名单公布!滨海新区入选22个行业高质量数据集
时间: 2024-12-20 15:11:46 浏览次数: 次浏览
在近日举办的“2024天津数据基础设施建设主题峰会”上,天津市数据局公布了第二批行业高质量数据集名单,共计100个。滨海新区数据局推荐的10家单位22个数据集悉数入选,成为本次名单的重要亮点。
此次入选的22个行业数据集涉及工业制造、人工智能、医疗健康、教育、城市治理、现代农业、文化旅游和交通运输等多个领域。数据集类型多样,包括文本、音频、图形图像和视频等模态,并经过严格的数据采集、清洗、归类和标注处理,具备完善的更新机制和安全维护能力。这些数据集集中体现了滨海新区在行业数据建设中的创新成果和特色优势。
早在今年6月,天津市数据局发布首批行业高质量数据集名单时,滨海新区已有9家企业的11个数据集成功入选。其中,包括基于隐私计算技术的政务流通数据集、恒达文博文旅•科普基础数据集等多个创新项目。其中,恒达文博文旅•科普基础数据集规模超300TB,包含超过五种数据模态,为国内首次公开发布,并已应用于基于ChatGLM等先进架构的大语言模型训练,展现了极高的数据应用价值。
未来,滨海新区数据局将持续推动行业数据集建设,与市级部门深度协作,发挥产业、科技和人才优势,整合通用、政用、商用数据资源,开发更多细分领域的行业数据集,提升数据供给能力。同时,将进一步激发数据要素的乘数效应,推动新区数字经济高质量发展,助力新时代“四宜”美丽“滨城”的建设目标。