杭州

首页>地方频道>杭州>要闻

AI要说正宗杭州话 紧急招募“老杭州”

想象一下,大伯大妈和机器人用杭州话谈天说地,年轻人“一键生成”杭州话说唱,小伢儿捧着杭州话AI“从早间头话到夜到头(杭州方言:从早说到晚)”,这是什么魔幻场景?

其实,AI距离会说正宗杭州话,只差“临门一脚”了!由浙江大学文学院、阿里巴巴AI Data团队牵头,浙大城市学院杭州语言服务协同创新研究中心协办的“杭州方言系统化采集工程”正在紧锣密鼓进行中。

AI看似无所不能,但让它学会说杭州话,其实是有难度的。这和杭州方言的特殊性有关。

“95后”杭州方言研究者高任飞是本次项目的主要参与者之一。他介绍,杭州话(杭州小片)属于汉语族下的吴语太湖片区,难就难在杭州话保留了古汉语中的清浊音、入声等语音特征,足有7个声调,甚至杭州话在连读时还会“再变调”,比如“西、湖”和“我到西湖”,“西、湖”两字的声调就不同。

“如果没有广大杭州市民动嘴录下来的数据支撑,AI说杭州话,只会说得一口‘洋泾浜’(指语言不规范)。”

目前,“杭州方言系统化采集工程”发出征集令,只要符合以下条件:自幼大部分时间生活在杭州老城区;能说一口自然、地道的杭州话,就可以加入杭州话AI的打造工程。

这个借助高科技的语言采集项目,更深层的含义是杭州方言的传承和保护。

“在杭州老城区,能流利说地道杭州话的人越来越少。年轻一代中,能自然用杭州话交流的,更是寥寥。承载历史记忆的杭州话,正面临传承的危机。我们不想让这份独一无二的声音,就这样沉默下去。”高任飞表示。

“只要你愿意为家乡话出一份力,我们都真诚欢迎你加入。加入方式很简单,用手机录制你朗读的杭州话,我们会提供简短文本,你用自然语速朗读即可。录音时长也自由安排,10分钟也好,几个小时也行。你的每句地道发音,都将被永久保存,进入杭州方言高质量数据库,成为未来研究、技术训练、文化传承的珍贵原料。对参与录音的志愿者,我们还将支付一定报酬。”

本次杭州方言采集主要针对杭州老城区及西湖周边龙井、梅家坞一带的方言,余杭、萧山、彭埠、转塘等地方言暂不纳入。2月13日起,市民可以用手机登录网站报名,并完成小测试。

“这个测试主要看你的杭州话是否地道,能否轻松应对。比如请你用杭州话说:‘我清个老早爬起来,望横河桥嗰把儿里走过去。’”

杭州话AI模型何时出炉?“参加录音的人越多,语料越丰富,这个模型就能越快发布。”今后,杭州话AI模型可以生成大段的杭州话文本以及语音,面向各种场景,包括公共服务、学术研究、杭州话学习等。

“我们的愿景就是用现代科技,为杭州话留下一份真实、完整、鲜活的‘数字声音档案’,让乡音在人工智能时代,依然能被听见、被读懂、被传递。”高任飞说。

声明:本媒体部分图片、文章来源于网络,版权归原作者所有,如有侵权,请联系删除:025-84707368,广告合作:025-84708755。
712
收藏
分享