近日,由北京市人民政府联合工业和信息化部、国家网信办、商务部、中国科协共同主办的“2023全球数字经济大会 - 人工智能高峰论坛”在北京召开。会上,网智天元作为中国领先的金融大模型智能服务提供商,首批入选“北京市人工智能大模型高质量数据集”。
人工智能大模型的突破源于高质量数据的不断发展,提升高质量数据要素供给能力是推动通用人工智能大模型领域创新的关键。但目前,针对大模型训练的高质量中文语料占比较少,不利于中文语境表达及产业应用。
能够提供可开放用于大模型训练及调优的高质量数据资源,也是针对“北京市通用人工智能产业创新伙伴计划”数据伙伴重要的评估要素。
网智天元入选第一批
《北京市人工智能大模型高质量数据集》
▲图|网智天元入选“北京市人工智能大模型高质量数据集”
在本次论坛上,发布了首批“北京市人工智能大模型高质量数据集”,共有10家单位的18个高质量训练数据集入选,包括网智天元的声誉风险事件数据集、藏语语音文本句对数据集,以及人民日报语料数据集、国家法律法规语料数据集,两会参政议政建言数据集、“科情头条”全球科技动态数据集,中国科学引文数据库数据集、科技文献挖掘语义标注数据集等,涵盖经济、政治、文化、社会、生态等不同领域,总规模超过500T,将为通用大模型和行业大模型训练提供有力保障。
此项荣誉的获得,是对网智天元大数据智能技术创新及实践、高质量数据建设的有力认可。公司持续专注细分领域大模型,夯实数据基础和数据资源保障,提升高质量数据要素供给能力,促进数据要素的高效流通和价值释放,助力通用人工智能大模型产业发展和数据要素市场的建设。