宁波

首页>地方频道>宁波>要闻

打造高质量数据集 宁波首批揭榜挂帅单位公布

昨日,浙江数商发展推进会上,宁波首批高质量数据集建设揭榜挂帅单位名单公布,23家涵盖制造、农业、政务等领域的重点企业将率先扛起打造宁波高质量数据集的重任。

“建设高质量数据集,点明了人工智能时代必须解决的一个问题:数据之于人工智能,就好比石油之于汽车。当下的互联网时代,每时每刻都在生产数据资源,却难以被有效利用起来。”市经信局相关负责人说,原油变成汽油,中间要经过分馏、裂解、催化等一系列复杂的工序。原始数据资源要变成可用、好用的“数据燃料”,同样也需要一套炼化流程,通过清洗、脱敏、标注、质检等手段,使数据准确、完整、一致。

这个过程,就是建设高质量数据集。它决定了人工智能从生成式AI向智能体AI演进时,能否拥有源源不断的动力。

据悉,此次公布的首批高质量数据集建设揭榜挂帅单位,大多也是国家数据开放利用的试点。比如,智昌、金山双鹿、吉利、云聚智铱的相关实践,已入选国家工业领域数据要素应用场景典型实践案例。

吉利汽车研究院“吉利汽车星睿高质量数据集”,蓝卓数字科技“面向绿色石化的工业制造行业的多模态高质量数据集”,入围国家高质量数据集建设先行先试试点,占全省试点总量的50%。

江丰生物入选国家高质量数据集建设典型案例,为省内唯一。

“数量全省领先的背后是宁波的率先布局。”该负责人说,宁波是省内首个产业数据价值化改革综合试点城市。今年以来,宁波积极响应工信部“工业数据筑基行动”,先行先试探索推进数据开发利用,场景应用融合赋能,促进数据要素价值持续释放。

就在昨日的活动中,宁波先行先试的范围再次扩容。其中,海曙区、江北区、鄞州区、宁波高新区四地入围浙江省高端数据标注基地试点;美康生物的“体外诊断企业可信数据空间”入选浙江省首批工业可信数据空间创新发展试点名单;宁波人工智能产业研究院的新材料行业数据集等5个项目入选浙江省第一批工业领域重点行业高质量数据集。

然而,建设高质量数据集,比拼的不仅是数据资源的占有量,更考验数据精炼及应用的能力。

下一步,宁波市将在原始数据采集的基础上,通过清洗去掉数据“杂质”、通过标注赋予“价值”、通过标准化实现“通用”,最终将数据变成可直接驱动AI模型的燃料。

声明:本媒体部分图片、文章来源于网络,版权归原作者所有,如有侵权,请联系删除:025-84707368,广告合作:19951968733。
549
收藏
分享