
数据标注在推动数据资源汇聚、提升数据质量、盘活数据要素价值中发挥着重要作用。自入选全国首批数据标注基地建设任务城市名单以来,合肥市以数据领域综合改革为主线,积极引进数据标注企业,培育人工智能训练师等新型职业人才,推动数据标注产业呈现良好发展态势。
数据标注
让AI更“聪明”
一直喜爱数学的冯影,从安徽师范大学应用统计学专业毕业后,顺利入职科大国创软件股份有限公司,成为了一名人工智能训练师。
她的日常工作就是数据标注,主要在电脑上对各类现实场景的原始数据进行处理,将其转化为机器学习可识别的专业数据。用她的话来说,人工智能训练师就像AI的“老师”。

科大国创九章AI平台(资料图)
“以现实交通场景举例,道路上有许多障碍物、建筑、绿植、车道线和行人等,我们把这些人、物标出来,标注后形成的数据可以变成无人驾驶车的‘眼睛’,告诉它们看见的是什么,应该怎么正确驾驶。”冯影解释道,通过向AI“投喂”海量的文本和图像数据,经过反复训练和调整,可以让AI模型变得更聪明,更能理解人类的世界。
在安徽数据堂科技有限公司(以下简称“安徽数据堂”)负责人张子斌看来,数据标注是机器感知现实世界的起点,是大部分人工智能有效运行的关键环节。“从细分环节来看,数据标注是对语音、图片、文本、视频等数据进行特征标签,将非结构化的数据转变为机器可识别的结构化数据。”
目前,安徽数据堂已形成数据多模态采集、自动处理、安全计算、模型评测的全链条核心技术体系及服务平台,为人工智能、无人驾驶等领域采集、标注的数据量超1000万条,服务项目覆盖讯飞星火、文心一言、腾讯混元等多个大模型。
张子斌表示,随着人工智能技术与细分领域的不断融合,各领域会产生许多新的数据需求,人工智能训练师等新型职业具备可观的上升空间,数据标注将在无人驾驶、医疗保健、智能安防等领域发挥重要作用。
加快构建
数字产业集群
近年来,合肥市将人工智能产业纳入“6+5+X”产业集群体系,聚焦发挥数据要素价值,全面布局人工智能产业,获批国家人工智能战新产业集群,产业实力跻身全国第一方阵,吸引了众多链上企业在合肥扎根。

合肥大智慧财汇数据科技有限公司(资料图)
作为全市第六批人工智能重点产业链企业,合肥大智慧财汇数据科技有限公司(以下简称“合肥大智慧财汇”)顺应发展趋势,打造了集数据容器管理、模型开发、模型训练及模型评估于一体的一站式综合平台,用户覆盖上市银行、保险机构、基金公司、证券企业等各类金融行业机构。
“2024年,公司标注文本近万个、2D图片单元格超6万个。”该公司产品经理李晓梅介绍,数据标注在对企业进行所属战新产业目录的分类工作中起着重要作用。比如通过机器学习、自然语言识别、数据标注等环节,根据《2023年工业企业战略性新兴产业分类标准》,再采用人工审核和专家咨询等方式对分类结果进行验证、调整,可以提高工作质效。在数据模型“帮助”下,去年对200多万家企业的所属战新产业进行了准确分类。
借“智”之力,乘“数”而上。在合肥,像合肥大智慧财汇一样,逐“数”兴业的企业还有很多。
坐落于中安创谷科技园的安徽飞数信息科技有限公司就是其中一家,其战略布局已覆盖合肥、武汉、西安、长沙、兰州、长春等城市,构建起面向“一带一路”、东南亚、东北亚地区的多语种数据标注矩阵。该公司自主研发的众包平台使用者遍布全国300多个城市及海外100多个国家,年数据生产能力超过1亿条。
当前,全国数据标注产业发展迎来众多利好。其中,《关于促进数据标注产业高质量发展的实施意见》提出,到2027年,数据标注产业专业化、智能化及科技创新能力显著提升,产业规模大幅跃升,年均复合增长率超过20%。
下一步,合肥市将聚焦释放数据要素乘数效应,围绕城市全域数字化转型,推动“公共数据+行业数据+企业数据”的高质量数据资源集聚,赋能社会民生和重点行业升级,带动社会数据标注创业者、小微企业、高校等创新创业,努力实现合肥数据标注基地共建、共享、共荣。








