• ↓爱上码• i3m.cn/10285•爱扫码 欢迎关注
  • #二维码.cn立刻有#二维码.cn/i3m.cn/10285
  • wwew.cn/i3m.cn/10285 →• i.i3m.cn/10285•←
  • 二维→•ErWei.com.cn/i3m.cn/10285•←
  • 闽南话智能识别系统: i3h.cn/10285
    二维码2019-06-03 14:37
    厦门日报:厦大研发的“闽南话智能识别系统”网上走红 对它说句闽南话 不到两秒就能译出来 不同口音都难不倒它

      用闽南话对着手机语音录入“爱拼才会赢”,语音输入后屏幕上立即显示“爱拼才会赢”字样。近期,一款名叫“闽南话识别”的软件在网络上走红。只要是日常对话的语句,不管你说的闽南话是厦门口音、泉州口音,或是漳州口音,它基本都能识别出来并翻译成文字,识别准确率高达85%文/图 本报记者 陆晓凤这款软件是厦大信息科学与技术学院副教授洪青阳、厦大人文学院中文系助理教授许彬彬带领的科研团队合作研发的。目前,这一软件已经过多阶段的内部测试,并开放供广大市民免费试用。记者与几位同学分别用厦门口音、泉州口音、漳州口音的闽南话,对着软件语音输入:“今天天气很好。”不到2秒,系统翻译出了相同的对应文字。记者又以略微不同的表达方式对着软件语音输入“今天天气很好”,系统依旧能准确识别。近日,记者采访了软件背后的科研团队,为您揭秘软件开发过程。


    闽南话识别系统界面。
    一位女士正对着手机用闽南话进行语音输入。


    调查

    采集多地语音资料连国外也不放过

    首先,该软件背后的语音资料库就很强大,这是基于许彬彬近10年来的研究成果。许彬彬带领团队借鉴、整理了大量语音资料——囊括福建省内厦、漳、泉多地的闽南方言、文本,甚至收集了国外多处讲闽南话的地点的语音材料。

    除了厦大的语音资料库外,每到寒暑假,许彬彬团队还会去各地进行田野调查。“省内的漳浦、东山等,以及菲律宾北部城市、美国的东部地区,每一个地点至少要停留5天,尽可能全面地描写该地区语音面貌。”她说。



    整理

    标注每个音节发音录入不同口音

    有了丰富的“食材”,烹制好这道“菜肴”还需要“配菜”。为此,许彬彬团队做了大量的整理工作。在许彬彬的电脑里储存着大量文档。“我现在有5台电脑,10个硬盘,全都装满闽南话文件。”许彬彬说,闽南话的声母有15-18个不等,韵母有73-90个不等,声调有5-8个不等,都要逐一整理,录入系统。

    别以为只是简单的标注,每个音节的发音以及发音时长,都必须详细标注下来。以“他们坐车去台北”为例,许彬彬就标注了16个音素,音素与发音时长还要逐一对应。而这只是一个句子的其中一种口音。

    许彬彬告诉记者,单单是厦门地区,细微的语音差别就有十几种。“思明区鹭江街道是一种口音,厦港街道又是另外一种口音,海沧东孚街道的口音又接近漳州口音,这些都要逐一标注。”她说,系统录入的不仅仅是厦门口音,还有泉州口音、漳州口音、潮汕口音等。



    建模

    收集十万句日常对话邀志愿者测试

    为了让这一系统的闽南方言数据尽可能全面,洪青阳团队又历时一年,先后收集近十万句闽南话日常对话。

    除了许彬彬所提供的语音资料外,测试阶段,他们还邀请了几百名志愿者参与测试,让系统“学习”不同口音的闽南话。待系统基本“学会”不同口音的闽南话后,洪青阳又给系统加大了难度——文读和白读都要会。

    闽南话中存在大量多音字,有着复杂的文读白读现象,以“大学”这一词为例,就有文读和白读两种读法。该团队对闽南话语音识别采取了特定规则的发音词典标注,并用革新后的算法建立了闽南话语音识别模型。



    将实现闽南话与

    普通话无障碍沟通

    当发音速度不一、吞音等情况出现时,软件如何准确识别?系统的背后还有一位“把关人”。当遇上系统无法识别的语音时,许彬彬团队就会进行分析,把新的表达整理成文档,扩充词典和句子语料。与此同时,洪青阳团队在系统后台不断完善算法,以学习到更多口音和生僻词汇。现在,系统依旧在不断完善升级。

    据了解,基于深度学习方法,他们目前正在研发闽南话合成系统,最终可以实现闽南话与普通话之间的无障碍沟通。洪青阳说,该系统预计在今年上半年上线。

     

    发布时间: 2019-03-26  厦门日报:厦大研发的“闽南话智能识别系统”网上走红 对它说句闽南话 不到两秒就能译出来 不同口音都难不倒它
    厦门日报:厦大研发的“闽南话智能识别系统”网上走红 对它说句闽南话 不到两秒就能译出来 不同口音都难不倒它


    短标题:创建者:李静发布时间:2019-03-26 23:40:28目录:地方媒体出处:新闻网



    [福建卫视新闻]厦大研发闽南方言人工智能语音系统


    短标题:创建者:李静发布时间:2019-03-13 09:37:14目录:地方媒体出处:新闻网图片:


    厦门电视台:厦大研发闽南方言人工智能语音系统:覆盖多种口音


    短标题:创建者:李静发布时间:2019-03-13 09:34:47目录:地方媒体出处:新闻网图片:

    0个回复, 0个喜欢
  • 二维码 ↓ 闽南话智能识别系统
  • i3h.cn/10285爱3好谢谢分享
  • 二维码.cn:↑i.i3h.cn/10285
  • 葩葩搜:paps.cn/10285需登录i3h.cn
  • 搜一搜.cn/检索词/'手机号'/样式新帖
  • Soys.cn/10285/15359936221/祝福语
  • 二维码 • Uid:2↑搜一搜•Tid:Soys.cn/10285

  • w.联系.cnOQRC.com/ii地址g.iidz.cn/15359936221

    内容正在加载中,请稍候……

  • 楼主:二维码的地址↓E空间网: →ekjw.com/u2 ↓
  • 扫一扫.cn→:私信 u2←二维码.cn
  • 二维码.cn↓E科教网↓ ekjw.com/u2
  • 二维码.cn↑名片 w.ekjw.com/u2 ←微看见友
  • 二维码.cn楼帖: 闽南话智能识别系统
  • 链接.cn原pc版→qrmi.cn/10285
  • 扫一扫.cn名本•i3好→i3h.cn/10285
  • 偶集到记事易及微博等
  • 2wm.com.cn#二维码.cn立刻有#
  • iidz.cn/zp•照片
  • 搜一搜.cn:Soys.cn易项目网:Exmw.cn
  • Bsss.cn•必上搜索鸣谢.cn:httt.cn/鸣谢
  • 微网话题王wwHTw.cn/名单印发介绍
  • 国搜推介.cn:i3h.cn/5667
  • httt.cn/检索搜一搜.cn•soys.cn建站易:jz1.com
  • 微博客户端@第一建站网#MADV全景#
  • i三好→ 下载app