|
| 研究計畫及報告 |
計畫類型 | 個別型研究 |
計畫名稱 | 網路上中文資訊自動分類系統 |
計畫主持人 | 陳稼興;林熙禎 |
研究者 | 陳宜欣、陳雅文、吳俊毅、陳南青 |
執行機構 | 教育部電子計算機中心 |
語文 | 中文 |
關鍵詞 | 網際網路;中文資訊自動分類系統 |
摘要 | 網路的普及使網路上的資訊迅速增加,如果不能有系統的儲存這些資訊,日後的查詢將變得十分困難。雖然全文檢索的技術可以解決部分問題,若能事先將這些資訊分類,則更可以加快檢索速度及提高檢索正確率。不過由於資訊增加的速度已遠大於人工分類的速度,自動分類的需求於是因應而生。文件自動分類是根據文件內容自動將性質相近的文件存放於鄰近的地方,以便日後的查詢。
本計畫研究類神經網路應用於文件自動分類之可行性,並與其他文件自動分類方法就效率及正確性作一比較。此外,並研究與檢索系統結合,以提高檢索速度及檢索正確率。
|
授權狀態 | 已授權 |
章節標目
標題 | 頁數 | 全文 |
| | |
第一章、前言 | 1-2 | |
第一節、起源 | 1 | |
第二節、系統主要目的 | 1 | |
第三節、系統實際結果 | 2 | |
第二章、傳統人工分類與以往文件自動分類的比較及方法 | 3-7 | |
第一節、傳統人工分類與以往文件自動分類的比較 | 3-4 | |
第二節、以往英文文件自動分類方法 | 4-5 | |
第三節、以往中文文件自動分類的方法及結果探討 | 5-7 | |
第三章、簡介類神經網路及使用工具 | 8-11 | |
第一節、類神經網路概要 | 8 | |
第二節、倒傳遞網路簡介 | 9 | |
第三節、以類神經網路作分類的優點 | 9-10 | |
第四節、類神經網路的限制 | 10 | |
第五節、類神經網路工具SNNS介紹 | 10-11 | |
第四章、實驗方法 | 12-14 | |
第一節、資料選取及類別選定 | 12 | |
第二節、關鍵詞的選取 | 12-14 | |
第三節、文章表示法 | 14 | |
第四節、類別表示法 | 14 | |
第五章、以類神經網路做自動分類的結果 | 15-18 | |
第一節、未調整樣本前的訓練結果 | 15-17 | |
第二節、調整樣本後的訓練結果 | 17-18 | |
第六章、分析實驗結果 | 19-22 | |
第一節、比較利用向量、類神經網路分類的結果 | 19 | |
第二節、分析訓練、測試結果落差的原因 | 20-22 | |
第七章、結論及未來方向 | 23 | |
第一節、結論 | 23 | |
第二節、未來方向 | 23 | |
第八章、參考資料 | 24 | |
附錄 | 25-35 | |
|