首頁 > 正文

主流價(jià)值語料庫

2024-10-14 15:08 | 來源: 中國(guó)記協(xié)網(wǎng)
【字號(hào): 打印  

  主流價(jià)值語料庫圍繞習(xí)近平新時(shí)代中國(guó)特色社會(huì)主義思想和中國(guó)式現(xiàn)代化涉及的經(jīng)濟(jì)、政治、法治、科教、文化、民生、生態(tài)等十幾個(gè)領(lǐng)域,在對(duì)國(guó)內(nèi)外主流大模型進(jìn)行安全評(píng)測(cè)的基礎(chǔ)上,針對(duì)大模型普遍遇到的意識(shí)形態(tài)安全問題,依托黨報(bào)黨網(wǎng)長(zhǎng)期建設(shè)發(fā)展形成的權(quán)威優(yōu)質(zhì)資源,以及黨和國(guó)家重要文獻(xiàn)資源,科學(xué)歸集、清洗、標(biāo)注、風(fēng)控,重點(diǎn)建設(shè)基礎(chǔ)語料、圖文語料、問答語料等多類語料,賦能人工智能的價(jià)值觀對(duì)齊,滿足全面性、專業(yè)性、時(shí)效性、導(dǎo)向正確性的要求,為人工智能大模型的安全持續(xù)發(fā)展護(hù)航。

  主流價(jià)值語料庫總體規(guī)模超過30T,其中基礎(chǔ)語料超過300億字,問答語料超過17萬對(duì)。與多個(gè)國(guó)內(nèi)主流大模型進(jìn)行集成對(duì)接,糾偏效果明顯。

責(zé)任編輯: 葛燕燕

关于我们 | 违法和不良信息举报电话:(010)61002963

Copyright 2007 - 2025 www.zgjx.cn All Rights Reserved

主办单位:中华全国新闻工作者协会       版权所有:中国记协网

京ICP备07018050号 互联网新闻信息服务许可证:10120170036  信息网络传播视听节目许可证:0109503

关于我们 | 违法和不良信息举报电话:(010)61002963

Copyright 2007 - 2025 www.zgjx.cn All Rights Reserved

主办单位:中华全国新闻工作者协会       版权所有:中国记协网

京ICP备07018050号 互联网新闻信息服务许可证:10120170036  信息网络传播视听节目许可证:0109503

010090110010000000000000011100001310786610