• 服务
  • 顾问
  • 资讯
400-047-0007

广西科技厅:关于开展广西行业垂类大模型数据训练基地申报工作的通知

时间:2025-11-17 14:58

各设区市科技局、各高新区管委会,各有关单位:

为深入贯彻落实自治区党委、政府关于加快推动人工智能高质量发展的决策部署,抢抓通用人工智能发展机遇,通过“成熟一个、带动一批”的建设模式,打造一批国内一流、辐射东盟的行业垂类大模型数据训练基地。现组织开展广西行业垂类大模型数据训练基地(以下简称基地)申报工作,有关事项通知如下:

一、申报对象

重点聚焦有色金属、动力装备、糖业、智慧水运、车联网等广西特色产业领域及应用场景,面向具备“三有”(行业数据、行业模型、行业算力)基础条件的市场主体。

二、申报条件

申报单位应满足以下条件:

(一)数据资源规模达标

拥有本行业高质量数据资源,具体需满足各类型数据量要求,其中文本数据条数不低于1000万条、图像或视频数据存储量不低于1PB、语音数据总时长不低于2000小时;混合多模态数据需满足文本、图像或视频、语音三者中任意一条的数据量标准。

(二)数据集质量与处理合规

高质量数据集需达到严格的质量指标,完整性不低于98%、准确性不低于95%、一致性不低于98%,时效性需满足当前行业应用场景最低时效性要求,相关性和无偏见性需满足行业应用场景最低要求;同时需完成数据标注、脱敏、合规审查等流程,并提供相关证明材料。

(三)数据治理体系认证达标

数据治理体系通过国家标准DCMM二级以上认证,或能够确保数据管理能力达到行业规范水平。

(四)训练数据与模型准确性要求

训练数据的标注准确性不低于95%;同一模型训练条件下,采用高质量数据集训练后,模型准确性相比使用传统数据集准确性提升20%以上,或直接达到不低于95%的准确性标准。

(五)自主可控垂类模型性能先进

已训练或正在训练的垂类模型参数规模不低于75B,且模型性能指标达到国内先进水平。

(六)算力资源配置充足

具备不低于30P FLOPS本地算力资源,或能够保障数据处理与模型训练的算力支撑。

(七)申报单位主体资格合规

申报单位需注册成立独立法人,且在广西区内开展相关活动1年以上。

(八)商业化应用场景与效益承诺

承诺自发布名单之日起,连续12个月内形成不低于3个商业化应用场景,并满足以下任一目标:年度新增产值不低于2000万元,或年度降本增效金额不低于5000万元。

(九)研发投入与团队配置要求

若申报单位为企业,年度研究开发费用总额占销售收入总额的比例不低于3%,或任一联合申报单位符合该比例要求;若为高校或科研院所,需具备专职研发团队,专职研发人员数量占总员工比重不低于30%,且拥有一定数量的高层次人才。

三、其他

(一)申报流程

申报单位根据计划建设的基地所属行业领域,确定基地名称,如“广西+行业关键词+垂类大模型数据训练基地”,在2025年11月30日前登录“广西科技管理信息平台”系统(gkg.kjt.gxzf.gov.cn),完成信息填报、上传附件材料和系统提交申请。

(二)材料审核

各设区市科技局、各高新区管委会通过“广西科技管理信息平台”完成对单位申报材料的完整性、合规性审查和推荐工作。

(三)管理模式

基地实行动态管理,需每年年末向自治区科技厅提交自评报告及佐证材料。对开展情况较差或整改未达标的基地,将取消资格,且3年内不得重新申报。

(四)支持推广

自治区科技厅将统筹政策、资金、算力、数据等资源对基地予以支持,推动其在特色产业场景中发挥示范引领和辐射带动作用。

联系人及电话:胡飘,0771—2630951。

广西壮族自治区科学技术厅

2025年11月14日

(此件公开发布)


TAGS: