火車采集器特別版是一款功能強大的網(wǎng)絡數(shù)據(jù)及信息查詢工具,用戶可以通過強大的配置,讓用戶可以從網(wǎng)絡上輕松的查找文字、圖片、音樂、視頻等資源,使得用戶能夠?qū)@些資源進行快捷的下載,并且為用戶提供眾多的高級采集功能,使得用戶能夠更加便捷、高效的進行數(shù)據(jù)及信息查詢。

1、通用性強
無論新聞、論壇、視頻、黃頁、圖片、下載類網(wǎng)站,只要通過瀏覽器能看到的結(jié)構(gòu)化的內(nèi)容,通過指定匹配規(guī)則,都能采集到您所需要的內(nèi)容。
2、穩(wěn)定、高效
五年磨一劍,軟件不斷更新進步,采集速度快,性能穩(wěn)定,占用資源少。
3、擴展性強、適用范圍廣
自定義web發(fā)布,自定義主流的數(shù)據(jù)庫的保存和發(fā)布,自定義本地php及.net外部編程接口處理數(shù)據(jù),讓數(shù)據(jù)都能為你所用。
1、規(guī)則自定義 - 通過采集規(guī)則的定義,可以搜索所有網(wǎng)站采集幾乎任何類型的信息。
2、多任務,多線程 - 可以同時進行多個信息采集任務,每個任務可以使用多個線程。
3、所見即所得 - 任務采集過程所見即所得,過程中遍歷的鏈接信息、采集信息、錯誤信息等都會及時的反映在軟件界面中。
4、數(shù)據(jù)保存 - 數(shù)據(jù)邊采集邊自動保存到關系數(shù)據(jù)庫中,并且數(shù)據(jù)結(jié)構(gòu)能夠自動適應,軟件可以根據(jù)采集規(guī)則自動創(chuàng)建數(shù)據(jù)庫,以及其中的表和字段,也可以通過導庫方式靈活的將數(shù)據(jù)保存到客戶已有的數(shù)據(jù)庫結(jié)構(gòu)中。
5、斷點續(xù)采 - 信息采集任務可以在停止后從斷點開始繼續(xù)采集,從此你用不再擔心你的采集任務意外中斷了。
6、網(wǎng)站登錄 - 支持網(wǎng)站Cookie,支持網(wǎng)站可視化登錄,即使登錄時需要驗證碼的網(wǎng)站也能采集。
7、計劃任務 - 通過這個功能可以讓你的采集任務定時、定量或者一直循環(huán)執(zhí)行。
8、采集范圍限制 - 可以根據(jù)采集的深度和網(wǎng)址的標識來限制采集的范圍。
9、文件下載 - 可以將采集到的二進制文件(諸如:圖片、音樂、軟件、文檔等等)下載到本地磁盤或者采集結(jié)果數(shù)據(jù)庫中。
10、結(jié)果替換 - 可以將采集的結(jié)果根據(jù)規(guī)則替換成你定義的內(nèi)容。
11、條件保存 - 可以根據(jù)某個條件來決定那些信息保存,那些信息過濾。
12、過濾重復內(nèi)容 - 軟件可根據(jù)用戶設置和實際情況對重復內(nèi)容和重復網(wǎng)址自動刪除重復內(nèi)容。
13、特殊鏈接識別 - 運用此功能可以將用JavaScript動態(tài)生成的鏈接或其他更古怪的連接識別出來。
14、數(shù)據(jù)發(fā)布 - 可以通過自定義接口,將已采集的結(jié)果數(shù)據(jù)發(fā)布到任意的內(nèi)容管理系統(tǒng)和指定數(shù)據(jù)庫中。現(xiàn)在已支持的目標發(fā)布媒體包括:數(shù)據(jù)庫(access, sql server,my sql,oracle) ,靜態(tài)htm文件。
15、預留編程接口 - 定義多個編程接口,用戶可以在事件中利用PHP,C#語言進行編程,擴充采集功能。
1、全自動
無人值守工作,配置好程序后,程序?qū)⒁罁?jù)您的設置自動運行,完全無需人工干預。
2、本地編輯
本地可視化編輯已采集的數(shù)據(jù)。
3、采集測試
這是其它任何同類采集軟件所不能比的,程序支持直接查看采集結(jié)果并測試發(fā)布。
4、管理方便
使用站點+任務方式管理采集節(jié)點,任務支持批量操作,再多的數(shù)據(jù)管理也很輕松。
5、支持所有網(wǎng)站編碼
完美支持采集所有編碼格式的網(wǎng)頁,程序還可以自動識別網(wǎng)頁編碼。
6、多種發(fā)布方式
支持目前所有主流和非主流的CMS,BBS等網(wǎng)站程序,通過系統(tǒng)的發(fā)布模塊能實現(xiàn)采集器和網(wǎng)站程序間的完美結(jié)合
1、新建分組
新建一個任務分組,選擇所屬分組,確定分組名稱和備注。
2、新建任務
確定所屬分組,新建一個任務,填寫任務名稱并保存。

3、Web發(fā)布配置
Web發(fā)布配置定義了如何登陸一個網(wǎng)站以及向該網(wǎng)站提交數(shù)據(jù)。
主要涉及到登錄信息的獲取,網(wǎng)站編碼設定,欄目列表的獲取,以及使用數(shù)據(jù)測試發(fā)布效果。

4、Web發(fā)布模塊
可以定義網(wǎng)站登錄,獲取欄目列表,獲取網(wǎng)頁隨機值,內(nèi)容發(fā)布參數(shù),以及上傳文件,構(gòu)造發(fā)布數(shù)據(jù)等高級功能。

5、數(shù)據(jù)庫發(fā)布配置
數(shù)據(jù)庫發(fā)布配置定義了數(shù)據(jù)庫鏈接信息的設置以及數(shù)據(jù)庫模塊的選擇。
6、數(shù)據(jù)庫發(fā)布模塊
用于編輯數(shù)據(jù)庫的發(fā)布模塊,方便我們將數(shù)據(jù)發(fā)布到配置好的數(shù)據(jù)庫中。
火車采集器可選mysql、sqlserver、oracle、access四種數(shù)據(jù)庫類型,在文本輸入框中填寫sql語句
(需有數(shù)據(jù)庫相關知識),并可使用標簽替換相應數(shù)據(jù)。也可在采集器模塊文件夾中加載某一模塊進行編輯。

7、計劃任務
設置列表中采集任務的啟動計劃,可每間隔、每天、每周、僅一次、或自定義Cron表達式,
(Cron表達式的寫法可參考相關術語中的介紹)。保存設置后,任務即可按照設置執(zhí)行。

8、插件管理
插件是可以用來擴展火車采集器功能的程序
火車采集器V9支持PHP源碼、C#源碼、C#類庫三種類型的插件,
可用于擴展http請求、內(nèi)容處理和文件下載的功能,并可以分別進行測試。
9、http二級代理
網(wǎng)絡中的服務器,可以讓網(wǎng)絡用戶去取得所需要的網(wǎng)絡信息。
代理的功能有可以突破自身ip的訪問限制訪問國外站點,訪問一些單位或團體內(nèi)部資源,
突破電信的ip封鎖和隱藏真實的ip等。
火車采集器V9支持http代理、socket4和socket5代理。

10、http模擬請求
可以設置如何發(fā)起一個http請求,包括設置請求信息,返回頭信息。并具有自動提交的功能。
1.調(diào)整列表頁排重的方式,現(xiàn)在僅會在同級列表頁之間進行排重。
2.增加對于任務運行完畢之后的運行統(tǒng)計的預警功能(Email郵件預警)【旗艦版功能】
3.新增支持對于一些請求返回碼不為200時,仍然進行采集的配置。
4.新增支持將下載地址保存為html文件的功能。
5.二次代理服務,增加導入的時候配置代理類型,同時修復對于用戶名密碼的顯示錯誤問題。
6.發(fā)布配置頁面,默認僅顯示當前選擇配置,加快任務加載時間。
7.修復命令行控制,closeapp參數(shù)無法自動關閉程序的問題。
8.修復在未選擇圖片水印時,無法進行圖片剪裁的問題。
9.優(yōu)化開始界面加載方式,解決初始化界面卡頓的問題。
10.修復在配置多行連接符包含“”導致的無法探測圖片下載的問題。
11.修復Excel導出數(shù)據(jù)時,列的順序與字段順序不一致的問題。
12.修復Excel導出數(shù)據(jù)時,一些包含數(shù)字的字段的導出數(shù)據(jù)錯誤問題。
13.修復任務批量編輯時,Json采集表達式未能復制的問題。
1贛教云教學通2.0-贛教云教學通2.0下載 v5......
2step7 microwin-西門子PLC S7......
3百度網(wǎng)盤清爽精簡純凈版-網(wǎng)盤工具-百度網(wǎng)盤清爽精......
4360安全瀏覽器-瀏覽器-360安全瀏覽器下載 ......
5谷歌瀏覽器 XP版-谷歌瀏覽器 XP版-谷歌瀏覽......
6Kittenblock重慶教育專用版-機器人編程......
7seo外鏈助手(超級外鏈) -SEO外鏈優(yōu)化工具......
8小米運動刷步數(shù)神器-小米運動刷步數(shù)神器下載 v2......