[C#] 如何從大量 JSON 檔案中找尋關鍵字 (Lucene.net篇-建立索引)

2012-10-05

 

 如何從大量 JSON 檔案中找尋關鍵字 (JSON.net 還原篇)如何從大量 JSON 檔案中找尋關鍵字 (Regular Expression 篇)

中對 10 萬筆個別 JSON 資料進行測試,但是結果卻是非常的慢…

大概都要花到 25~30 秒的時間…

 

正所謂..

20091213_7603ed814ea10fa6874dc5j88ho5hZqp_2

 

如何更快.. 是我腦中一直想到的…


[C#] 如何從大量 JSON 檔案中找尋關鍵字 (Lucene.net 篇 - 關鍵字搜尋)


上一篇文章 如何從大量 JSON 檔案中找尋關鍵字 (Lucene.net 篇 - 建立索引)
我們提到如何將十萬筆資料製作索引..
接下來我們就是對索引進行搜尋..

資料來源 (前情提要)

首先我在 Source 這檔案夾下面建立 10 萬筆資料,不多,但是也不太少,但是產生跟複製的時候足以讓我電腦 hang 住..
這資料結構長這樣
{

"Id":"4",

"Memo":"的,你快挖了丁老賊的眼珠出來,給我報仇。」蕭峰一時難以明白其間真相,目光環掃,在人君中見到了段正淳和",

"Birthday":"1900-01-05T00:00:00",

"Age":4

}



[C#] 透過Lucene.net 進行關鍵字搜尋 - 關於 Hits will be removed in Lucene 3.0. Use Search(Query, Filter, int) instead

 

前幾天提到如何透過 Lucene.net 進行建立索引,還有進行關鍵字搜尋

建立索引: 如何從大量 JSON 檔案中找尋關鍵字 (Lucene.net 篇 - 建立索引)

搜尋: 如何從大量 JSON 檔案中找尋關鍵字 (Lucene.net 篇 - 關鍵字搜尋)

 

雖然搜尋結果很快,但是地表上最強 IDE Visual Stuio 2012 一直在那邊一一歪歪..


[Visual Studio] 無法找到程序輸入點 _Atomic_fetch_sub_4(在動態連續程式庫C:\Program Files (x86)\Microsoft Visual Studio 11.0\Common7\IDE\devenv.exe

 

電腦環境 Windows 8 Release Preview Build 8400

然後 VS 是 RC x86  版本..

今天我在裝完 Office 2013 Preview (x84) 版本之後一直跳出..

無法找到程序輸入點 _Atomic_fetch_sub_4(在動態連續程式庫 C:\Program Files (x86)\Microsoft Visual Studio 11.0\Common7\IDE\devenv.exe

 

sshot-31_2

上網 Google  一下發現 Visual Stuio 有 patch ..

我都已經要準備重灌 VS 立馬按下取消…


[C#] Lucene.net - 透過 IndexReader 刪除索引中的指定資料…

 

使用 Lucene 建立索引後基本上,更新他做的動作都是刪除後,全部重做..

但是如果是要刪除某筆資料是可以做到的,這樣可以避免重新再製作一次 index ..

如何建立索引資料可以參考此篇 http://www.dotblogs.com.tw/junegoat/archive/2012/08/03/c-sharp-lucene-create-index.aspx

畢竟當資料一大,製作 index 是很花時間的…

原本製作 index 後我搜尋資料…

 

sshot-33_2


[C#] Lucene.net–對於搜尋結果進行排序

 

上次有篇文章 如何從大量 JSON 檔案中找尋關鍵字 (Lucene.net 篇 - 關鍵字搜尋)

有朋友提到說,為什麼搜尋結果怪怪的,跟之前幾篇..

如何從大量 JSON 檔案中找尋關鍵字 (JSON.net 還原篇) 為什麼不同..

其實是因為搜尋出來的結果,並沒有排序,這篇文章我們來看看怎麼進行排序 …

看一下原本的搜尋..


當麻許的超技八 2014 | Donma Hsu Design.