[C#] 盤古分詞,尋找句子中的分詞
2012-10-29
大家在學英文的時候,不是有學過..
主詞 + 動詞 + 受詞 ex. I love you.
主詞 +be 動詞 + 形容詞 / 名詞 ex. I am a developer.I am happy.
其實中文也有,只是從小就很熟習用法..
所以不太會去注意…
但是 一句話 你可以看得出中間的每一個分詞..
譬如例句:
當麻跟一群正妹去散步,不小心碰到阿凱凱
在你腦中會解釋:
當麻 跟 一群 正妹 去 散步 不 小心 碰到 阿凱凱
但是其實這都是要靠中文分詞的 Library 才會辦到..
這也是各大搜尋的原理之一,必須去判斷分詞跟斷句 …
對這一塊有興趣的 可以問一下一位高手學長 陳智揚老師
之前跟他聊過 他對這一塊頗有深入研究…
最近在看一套分詞軟體叫做盤古, 接下來做很簡單的介紹...
下載網址:http://pangusegment.codeplex.com
下載後,可以引入 Library : PanGu.dll
之後我們就來測試一下分詞能力…
範例文字: 當麻跟一群正妹去散步,不小心碰到阿凱凱
using System;
using PanGu;
namespace PanGu_Test
{
public partial class PanGuTest : System.Web.UI.Page
{
protected void Page_Load(object sender, EventArgs e)
{
}
protected void btnSplit_Click(object sender, EventArgs e)
{
var segment=new Segment();
var words= segment.DoSegment(txtWords.Text);
foreach (var word in words)
{
Response.Write(word+"<br />");
}
}
}
}
結果:
那是因為他字典沒有引入,所以我們必須去這裡下載 字典檔
http://pangusegment.codeplex.com/releases/view/47411
接壓縮至專案 \Dictionaries\ 下…
我們來測試一下…
這結果好像不是我們要的…
在下載的 libray 中 有一個 DictManage.exe
就這樣建立 當麻 正妹 之後它的結果就會是…
蠻好玩的 有興趣可以玩玩看…
Smaple:
標籤:
ASP.net
,
C#
,
Lucene.net
-- Yesterday I wrote down the code. I bet I could be your hero. I am a mighty little programmer. 如果這篇文章有幫助到您,簡單留個言,或是幫我按個讚,讓我有寫下去的動力...