功能項 | 功能描述 |
---|---|
元搜索采集 | 從百度、谷歌、必應采集 ,參見 SI-16 SI-26 |
網站爬蟲采集 | 從網站爬取數據,自動智能識別標題、正文、時間,自動過濾廣告和導航欄 ,參見 SI-18 SI-28 |
論壇采集 | 自帶多個模板,支持定制模板 ,參見 SI-17 SI-27 |
百度貼吧采集 | 通過關鍵詞搜索并采集百度貼吧內容 ,參見 SI-22 SI-32 |
微信公眾號采集 | 通過關鍵詞搜索并采集微信公眾號符合條件的內容 ,參見 SI-23 SI-33 |
本地文件采集 | 在本地計算機采集文件,支持ZIP、RAR壓縮文件(無密碼) |
數據處理 | 清洗、整合、標準化等處理 |
全文提取 | 支持一百多種文件文件格式,提取全文文本 |
標題與正文智能提取 | 無需配置模板,智能識別與提取標題和正文,自動去除導航欄、廣告等無效信息 |
全文檢索 | 支持所有文本內容的全文搜索 |
全文檢索 | 在全文中搜索、自動摘要等 |
智能分類 | 自動識別語義,按照設置樣本對文件進行分類 |
自然段整合 | 跨文章將相似自然段整合一起 |
知識庫設置 | 將經驗知識、案例知識、有價值文字設置為知識庫 |
正則表達式抽取 | 輸入正則表達式,根據模式自動抽取符合規律的未知內容 |
獨特優勢 | (1) 內置精準語義引擎的按需采集型軟件,采集下來的文章幾乎100%符合需求,而不是像市場同行一樣95%數據都是垃圾文檔
(2) 無需配置模板,自動提取標題、時間和正文,自動過濾導航欄和廣告 (3) 任務驅動型,按需采集型,和市場同行傳統軟件思路大不同 |
服務項 | 服務描述 |
---|---|
SDK | 有,免費提供,包括JAVA、C++、C# |
示例源碼 | 有,免費提供 |
技術指導 | 有,免費提供 |
定制開發 | 可,議價 |
項目承建 | 可,議價 |
場景項 | 場景描述 |
---|---|
競爭情報保障 | 設置競爭情報課題,持續監控競爭情報信息 |
專題情報保障 | 設置專題情報課題,持續監控競爭情報信息 |
知識庫保障 | 構建知識庫,將案例知識、經驗知識、有價值文字設置為知識庫 |
輿情監控 | 監控自媒體、社交媒體 |
智庫建設 | 輔助智庫建設,提供數據采集與分析系統 |
示例項 | 示例圖片 |
---|---|
采集設置 | ![]() |
任務設置 | ![]() |
采集結果 | ![]() |
全文檢索 | ![]() |
產品 | 頁面鏈接 |
---|---|
身份證解碼類 | 身份證解碼類產品 |
計算機視覺類 | 計算機視覺類產品 |
大數據情報類 | 大數據情報類產品 |
全部產品列表 | 全部產品列表 |
拳頭產品 ![]() |
拳頭優勢產品清單 |