资讯
2026/6/29 11:20

趣链科技AI高质量数据集公共服务平台:以可信数据基础设施支撑行业AI落地

0
0

人工智能竞争正在从单纯比拼算力,转向对高质量数据、行业知识和可信治理能力的综合竞争。对于行业大模型而言,数据不是训练前的准备材料,而是决定模型效果、可控性与应用边界的核心资产。2026年,国家数据局印发《关于推进行业高质量数据集建设行动的实施方案》,行业高质量数据集建设进入加速阶段。在这一背景下,杭州趣链科技股份有限公司(以下简称“趣链科技”)依托AI高质量数据集公共服务平台,为政府、行业机构与企业提供从数据治理到模型应用的全流程支撑,帮助行业AI获得更可靠、更合规、更可用的“训练教材”。

高质量数据集并不是简单的数据汇总。它通常指经过采集、清洗、加工、标注、评估与合规处理后,可直接用于AI模型训练、微调、评测或知识库构建,并能够有效提升模型性能的数据集合。其价值主要体现在高价值应用、高知识密度和高技术含量三个维度。趣链科技AI高质量数据集公共服务平台围绕数据需求发布、数据托管、多模态预处理、数据标注、质量评估、合规监测和在线模型微调等环节,形成覆盖模型训练、模型微调、模型评测、行为约束与知识库构建的闭环能力。

在实际建设中,高质量数据集的难点不只在于“有数据”,更在于数据能否被持续验证。趣链科技平台将测试验证嵌入数据集生成、治理和应用的全生命周期:质量评估能力可对不同阶段的数据集进行抽样质检,输出评分明细,识别内容干净度、完整性和缺失程度;合规监测能力可发现重复数据、涉黄暴恐等敏感内容、空值乱码、个人隐私等风险,并定位到具体文件。通过质量评估、合规监测和应用反馈的持续闭环,平台帮助数据要素运营方把分散、庞杂的原始数据转化为AI“用得上、用得准、用得稳”的高质量数据集。

这种全流程能力已经在文旅、工业、文博等场景落地。文旅领域是近期具有代表性的样本。2025年,重庆接待国内外游客5.06亿人次,城市文旅服务对数据治理和AI应用提出了更高要求。但在实际运营中,景区、地图、短视频、票务、交通等数据分布在不同平台,格式、口径和标准并不统一。要让AI理解一座城市,首先需要把这些多源异构数据治理为可训练、可检索、可调用的高质量数据集。“重庆旅游高质量数据集”正是围绕这一目标建设的城市级方案。

该方案构建了“一平台、二十数据集、一空间、十场景”的总体框架:1套全流程治理平台,20个覆盖文本、图像、视频、时序数据的多模态文旅高质量数据集,1个可信数据空间,以及10个AI应用场景。项目预计沉淀文本数据超2.5TB、图像数据超6TB、视频数据高达600TB,可直接赋能客流预测、游客画像与个性化推荐、智能问答讲解、图像异常检测等核心文旅AI场景。

在重庆项目中,趣链科技扮演文旅数据要素的“筑基者”与“连接器”:依托可信数据空间构建合规共享的流通基座,对位置轨迹、人脸、支付等敏感信息进行严格去标识化处理;以“采集端实时校验、治理端逻辑核查、应用端反馈回检”的三检机制建立数据质量标准;并通过“AI预标注+人工精标+双人交叉审核”体系,盘活文博非遗等长期沉淀的数据资产。

除文旅之外,平台能力也在工业和文博场景中持续验证。在工业领域,华翔智联依托该平台打造“工业铸造加工高质量数据集”,支撑“智能体工厂”建设;在文博领域,平台将高质量数据集与KG-enhanced LLMs(知识图谱增强大语言模型)结合,支撑某博物馆文物保护场景。

未来,趣链科技将持续推动高质量数据集在更多行业场景中的建设与应用,帮助数据真正转化为可训练、可验证、可落地的AI能力。

C114中国通信网版权说明:凡注明来源为“C114通信网”的文章皆属C114版权所有,除与C114签署内容授权协议的单位外,其他单位未经允许禁止转载、摘编,违者必究。如需使用,请联系021-54451141(汪先生)。其中编译类仅出于传递更多信息之目的,系C114对海外相关站点最新信息的翻译稿,仅供参考,不代表证实其描述或赞同其观点,投资者据此操作,风险自担;如有翻译质量问题请指正

给作者点赞
0 VS 0
写得不太好

C114简介     联系我们     网站地图

Copyright©1999-2025 c114 All Rights Reserved 沪ICP备12002291号-4

C114通信网版权所有 举报电话:021-54451141 用户注销