國家茶葉全產業鏈大數據中心于2019年11日13經農業農村部批復,2021年9日16通過農業農村部驗收。中心從國家戰略需求出發,落實國家關于數字農業農村發展的部署要求,為涉茶政府部門、經營主體、科研機構、公眾等提供專業權威的數據服務,致力于支撐茶產業科學決策,提高茶產業數字化水平,助推我國茶產業數字化轉型,同時為數字農業項目建設提供試點經驗。中心開展茶產業數據的采集、存儲、挖掘工作,在功能上按照一體化管理和模塊化應用思路進行,并強化了數據采集和應用功能,開發了豐富多元的數據采集功能,同時根據具體的應用場景開發了相對獨立的數據挖掘和模型系統。目前已具備數據采集、分析和發布能力,其中消費趨勢數據、電商數據、輿情監測數據已經具有明顯的輔助決策能力,對全面把握茶產業運行規律、產業政策制定、指導科學決策開始發揮作用。

建設內容:
1.茶葉全產業鏈數據倉庫
利用大數據技術對互聯網采集信息進行加工處理,按照茶產業、茶科技、茶文化三大主題板塊初步建成一批涉茶專題庫。例如:匯聚涉茶電子商務數據上萬條,全面、真實地反映被監測區的茶葉品牌線上流通情況,為指導茶葉經營決策提供可靠數據來源;匯聚國際及國內茶葉生產情況數據上萬條,為分析國內外茶產業發展差異、了解國內外茶葉發展情況提供數據支撐;匯聚茶葉昆蟲標本數據3000余條,提供在線瀏覽、檢索標本服務,提升標本管理準確性,降低了對實物標本的人為損壞幾率...目前三大板塊專題數據庫建設10個,供社會公眾免費查詢。
2.數據挖掘與決策系統
中心建有功能相對完善的數據匯聚與挖掘平臺。數據挖掘系統可實現混搭數據的融合和數據價值發掘,具備分析系統的功能、分析能力和計算能力。通過數據采集系統的治理及清洗,數據挖掘系統將基于這部分數據,進行指數編制、數學建模、查詢統計、機器學習、可視化展示等工作,實現對數據的綜合利用,為茶產業生產、管理與科學研究提供各類統計、檢索、分析、識別、評估、預測、決策等服務。
3. 茶葉輿情與熱點監測系統
對互聯網上涉及茶葉全產業鏈的政策信息、消費趨勢、敏感事件等信息進行全面匯聚,開發輿情分析產品與服務,包括茶葉輿情預警服務系統、茶葉互聯網輿情年度報告,為政府部門、生產經營者提供茶葉產業鏈社會關注焦點,進而為提前研判茶葉產業形勢提供依據。利用NLP(自然語言處理)技術對帶有情感色彩的主觀性文本數據進行分析、處理、歸納和推理。可以將消費者對產品的評價以數字的形式直觀地展現,可以形成關鍵字云圖。

4. 茶葉消費趨勢監測系統
對互聯網上涉及茶葉消費的電商平臺,監測主要茶類消費流通端的銷售數據,主要包括六大茶類銷售額數據、各省份茶葉銷量訂單、各月份茶葉銷量訂單、熱點城市茶葉銷量訂單、各茗茶銷量訂單以及各品牌銷售金額情況等等。
5. 茶病茶蟲數字標本線上博物館
茶樹病蟲數字標本館平臺將中國農業研究院茶葉研究所標本館藏的5目36科109種3000條標本搬上了數字化平臺,研究人員通過網絡查詢數字標本館,不僅能跨越時空,全方位、多層次檢索研究標本信息,還可以與自然因子、其他生物信息相結合探索生物多樣性及其保護的難點問題,為科學研究、多樣性保護決策及公眾查詢提供更優質、更高效的服務。

6. 數據挖掘應用場景案例
針對茶產業研究的不同主題所需要用到的不同的計量模型或機器學習算法,大數據平臺也內置了數據挖掘算法,實現常用算法的封裝,集成目前主流的計量統計分析模型,可簡單便捷的進行計量模型的抽取與運算。
