多媒體數(shù)據(jù)庫的特點_新華社多媒體數(shù)據(jù)庫 -簡介
新華社多媒體數(shù)據(jù)庫匯集新華社文字、圖片、圖表、視音頻、報刊等全部資源和社會上其他有價值的新聞信息資源,是國內(nèi)最大規(guī)模的多媒體、多文種新聞信息綜合性數(shù)據(jù)庫。文字系統(tǒng)不僅收錄了新華社全部原創(chuàng)新聞信息,還匯集了大量的海內(nèi)外媒體數(shù)據(jù)資源。通過整理加工形成的數(shù)百個特色鮮明的新聞信息產(chǎn)品,以其豐富的內(nèi)容為廣大用戶提供誠信的服務(wù)。文字系統(tǒng)數(shù)據(jù)庫目前擁有信息約2000萬篇,并以每天近萬篇的數(shù)量增加。
新華通訊社作為國家通訊社,信息管理應(yīng)用服務(wù)系統(tǒng)擔(dān)負(fù)著采集、發(fā)布、管理各類文字及圖片信息的重大任務(wù)。其采集的信息涉及政治、外交、經(jīng)濟(jì)、文教、科技、法律等各個領(lǐng)域并具有信息量大、權(quán)威、準(zhǔn)確、及時、豐富等特點。不僅為國內(nèi)外的新聞機構(gòu)和企事業(yè)單位提供大量的新聞素材,同時也承擔(dān)國家重大活動的新聞報道工作。
新華社多媒體數(shù)據(jù)庫始建于1999年,采用TRS全文檢索的核心技術(shù),2002年,TRS公司與新華社技術(shù)局再次合作實施了新華社多媒體數(shù)據(jù)庫英文檢索引擎的提速改造,提速后的系統(tǒng)對于多媒體數(shù)據(jù)庫的全文檢索能夠達(dá)到3~5秒左右響應(yīng)。目前,多媒體數(shù)據(jù)庫中已經(jīng)存儲了數(shù)千萬條多媒體信息,數(shù)據(jù)容量接近8T,內(nèi)容涵蓋中、英、法、西、阿、俄等9大主流語種,以文字信息為主,包含圖片、圖表和音視頻信息。
新華社多媒體數(shù)據(jù)庫底層采用TRS和Oracle協(xié)同工作的解決方式,由TRS完成千萬級數(shù)據(jù)的索引檢索服務(wù),由Oracle 完成信息制作流程,檢索方式分為本地聯(lián)機檢索和遠(yuǎn)程網(wǎng)絡(luò)檢索兩種方式,可進(jìn)行精確檢索、模糊檢索、全文檢索、對各檢索入口項實行任意聯(lián)合組配檢索;可實現(xiàn)多級檢索,逐級細(xì)化檢索條件,直至命中滿意的檢索結(jié)果;能夠?qū)z索結(jié)果排序。提供中英文全文檢索功能,中文按詞進(jìn)行全文檢索,具有智能詞庫機制。對圖片可按分類號、作者、拍攝時間、拍攝地點、照片文字說明等項檢索,其中文字說明項可實現(xiàn)中文按詞全文檢索。支持邏輯庫功能,支持跨庫檢索。支持文字資料和圖片資料的系統(tǒng)鏈接。
新華社多媒體數(shù)據(jù)庫作為新華社核心存儲的地位也在不斷加強,從以前分散的存儲逐步向統(tǒng)一存儲、統(tǒng)一管理、統(tǒng)一服務(wù)方向發(fā)展。在這個過程中,新建設(shè)的其他應(yīng)用系統(tǒng)中,TRS也積極的參與了廣泛的應(yīng)用研究,并在很多系統(tǒng)中直接集成了TRS全文檢索的核心功能,以保證數(shù)據(jù)的檢索性能和統(tǒng)一數(shù)據(jù)的要求。
多媒體數(shù)據(jù)庫的特點_新華社多媒體數(shù)據(jù)庫 -文字系統(tǒng)
新華社新聞庫每日實時發(fā)布中、英、法、西、俄、阿、葡7種文字新聞2000余條,60萬字,內(nèi)容涵蓋面廣,時效性強,權(quán)威可靠。新華社54年新聞稿庫收錄了新華社自1948年以來的全部稿件210萬篇,約18億漢字,全部稿件按內(nèi)容進(jìn)行專題、地區(qū)等六項分類,既是一部反映時事動態(tài)的活詞典,更是一部歷史真實記錄的百科全書。
信息細(xì)分類庫除新華社自采經(jīng)濟(jì)信息、報刊原創(chuàng)信息外,還攬括了海內(nèi)外數(shù)百種權(quán)威報刊及合作伙伴提供的商業(yè)信息。內(nèi)容按150多個行業(yè)進(jìn)行分類,并標(biāo)引有國別和中國各省市地區(qū)代碼。每天增加信息3000余條,300萬漢字。
產(chǎn)經(jīng)分析庫按各類報告、經(jīng)濟(jì)預(yù)測、經(jīng)濟(jì)分析、熱點透視、專題調(diào)研、市場行情及行業(yè)進(jìn)行分類,內(nèi)容不僅攬括權(quán)威媒體的報道,還涉及業(yè)內(nèi)專家的點評。每天增加信息160余條,16萬漢字。
公司企業(yè)庫按高管信息、公司動態(tài)、市場評論、業(yè)績報告公告、背景資料及行業(yè)進(jìn)行分類;收集了中國和部分外國上市和非上市企業(yè)的基本情況,包括領(lǐng)導(dǎo)人、企業(yè)性質(zhì)、通信地址等,內(nèi)容隨時更新。
新產(chǎn)品新技術(shù)庫新產(chǎn)品新技術(shù)庫主要介紹國內(nèi)外各行業(yè)重要的新技術(shù)、新產(chǎn)品和新工藝。每天增加150余條,15萬漢字。

決策參考庫
按部委信息、高層講話、權(quán)威發(fā)布、特別關(guān)注、專家論壇及行業(yè)進(jìn)行分類。每天增加100余條,10萬漢字。
統(tǒng)計數(shù)據(jù)庫收錄自建國以來國家及各省、市、自治區(qū)地方統(tǒng)計機構(gòu)的統(tǒng)計年鑒及海關(guān)統(tǒng)計、經(jīng)濟(jì)統(tǒng)計快報等月度季度統(tǒng)計,其中部分統(tǒng)計數(shù)據(jù)可以追溯到1949年,亦包括部分海外地區(qū)的統(tǒng)計數(shù)據(jù)。數(shù)據(jù)按行業(yè)及地域分類,數(shù)據(jù)日期以同一篇信息中的最后日期為準(zhǔn)。每天增加200余條,21萬漢字。
新華社經(jīng)濟(jì)信息庫全文實時收入新華社新聞信息中心的30種信息產(chǎn)品,1995年1月1日起建庫,每日新增中英文經(jīng)濟(jì)信息1000余條,30萬字。該庫設(shè)立30多個子庫:輕工、IT與家電、紡織服裝、醫(yī)藥衛(wèi)生、農(nóng)業(yè)糧油食品、機械、汽車、金屬、能源、化工、房地產(chǎn)建工建樹、經(jīng)濟(jì)貿(mào)易、綜合金融、新技術(shù)與新產(chǎn)品、合作與投資、商品供求、市場行情、中國市場動態(tài)與分析、海外市場動態(tài)與分析、中國經(jīng)濟(jì)動態(tài)、海外經(jīng)濟(jì)動態(tài)、金融行情、海外內(nèi)部信息、內(nèi)部信息、教育內(nèi)部參考、中外環(huán)保信息、中外科技信息、媒體財經(jīng)信息、移動短信息等。
人物庫分為國內(nèi)人物和國際人物、華人華僑、港澳臺人物的地區(qū)子庫,按屬性分為黨政軍人物、財經(jīng)人物、體育人物、教科文衛(wèi)人物等子庫,重點收集國際國內(nèi)知名人士的簡歷、主要業(yè)績、工作和生活活動情況及其它信息,另外還收錄大量人物剪報,內(nèi)容隨時更新。
組織機構(gòu)庫分為中國組織機構(gòu)庫和國際組織機構(gòu)庫兩個子庫,系統(tǒng)收集了中國和世界100多個國家(地區(qū))的政府機構(gòu)、政黨、社會團(tuán)體及聯(lián)合國等國際組織的基本情況和領(lǐng)導(dǎo)人名單,內(nèi)容隨時更新。
專題資料庫該庫以基本事實為依據(jù),收集了經(jīng)過系統(tǒng)編輯加工的關(guān)于國際國內(nèi)政治、經(jīng)濟(jì)、文化、科技、教育、軍事、外交等領(lǐng)域的各種重要專題資料,隨時更新。
體育庫分為體育新聞、體育記錄、比賽成績、體育專題資料、體育大事記、體育機構(gòu)、體育人物等子庫,系統(tǒng)收錄國內(nèi)外各項體育賽事和體育事業(yè)發(fā)展的詳細(xì)資料。
法規(guī)庫收集中華人民共和國自1949年以來中央及地方的法律法規(guī),以及各行業(yè)有關(guān)條例和案例,法規(guī)庫下分規(guī)文獻(xiàn)庫和法規(guī)報道庫兩個子庫。
譯名庫該庫經(jīng)專業(yè)人士數(shù)十年的規(guī)范化翻譯、加工整理,收錄了120多萬條各類中英文譯名,分為人名、地名、機構(gòu)、企業(yè)、報刊通訊社、其它6個子庫,是一部不斷擴(kuò)充的權(quán)威性譯名辭典。
報刊媒體庫不僅擁有《中國證券報》、《上海證券報》、《經(jīng)濟(jì)參考報》、《半月談》、《
愛華網(wǎng)本文地址 » http://www.klfzs.com/a/8103250103/29545.html
愛華網(wǎng)



