[C#] 盤古分詞,尋找句子中的分詞

2012-10-29


大家在學英文的時候,不是有學過..
主詞 + 動詞 + 受詞 ex. I love you.
主詞 +be 動詞 + 形容詞 / 名詞 ex. I am a developer.I am happy.

其實中文也有,只是從小就很熟習用法..
所以不太會去注意…
但是 一句話 你可以看得出中間的每一個分詞..
譬如例句:
當麻跟一群正妹去散步,不小心碰到阿凱凱
在你腦中會解釋:
當麻  跟   一群   正妹  去  散步  不  小心 碰到  阿凱凱
但是其實這都是要靠中文分詞的 Library 才會辦到..
這也是各大搜尋的原理之一,必須去判斷分詞跟斷句 …
對這一塊有興趣的 可以問一下一位高手學長 陳智揚老師
之前跟他聊過 他對這一塊頗有深入研究…
最近在看一套分詞軟體叫做盤古, 接下來做很簡單的介紹...

下載網址:http://pangusegment.codeplex.com
sshot-42_5

下載後,可以引入 Library : PanGu.dll
之後我們就來測試一下分詞能力…
範例文字: 當麻跟一群正妹去散步,不小心碰到阿凱凱

using System;
using PanGu;
namespace PanGu_Test
{
    public partial class PanGuTest : System.Web.UI.Page
    {
        protected void Page_Load(object sender, EventArgs e)
        {
        }
 
        protected void btnSplit_Click(object sender, EventArgs e)
        {
           var segment=new Segment();
           var words= segment.DoSegment(txtWords.Text);
 
            foreach (var word in words)
            {
                Response.Write(word+"<br />");
            }
        }
    }
}



結果:

sshot-43_thumb



那是因為他字典沒有引入,所以我們必須去這裡下載 字典檔

http://pangusegment.codeplex.com/releases/view/47411

接壓縮至專案 \Dictionaries\ 下…



sshot-44_thumb



我們來測試一下…

sshot-45_thumb

這結果好像不是我們要的…

在下載的 libray 中 有一個 DictManage.exe



sshot-47_thumb_1



就這樣建立 當麻 正妹 之後它的結果就會是…



sshot-48_thumb

蠻好玩的 有興趣可以玩玩看…

Smaple:


當麻許的超技八 2014 | Donma Hsu Design.