MR^3 22.5.1 Released
Merge branch 'unit-test-and-refactoring'
Merge branch 'unit-test-and-refactoring'
Merge branch 'unit-test-and-refactoring'
Merge branch 'unit-test-and-refactoring'
Merge branch 'unit-test-and-refactoring'
Merge branch 'unit-test-and-refactoring'
Merge branch 'unit-test-and-refactoring'
Merge branch 'unit-test-and-refactoring'
Merge branch 'unit-test-and-refactoring'
* 英語のWordSpaceで英語の同義語を取得していなかったために,概念対が獲得できていなかったを修正
* batファイル中のパスを修正
* EDR辞書をDODDLEで参照する辞書の形式に変換するクラスを実装
* EDR専門辞書の概念を利用してオントロジーを構築できるようにした
* デフォルトの名前空間に対応する接頭辞をconfigファイルで設定できるようにした
* オントロジータブを追加し,EDR一般辞書,EDR専門辞書,WordNetを利用するかしないかを選択できるようにした
ドキュメントを更新
DODDLE_Startup関連がパッケージの変更に追従できていなかったのを修正.
* 概念検索の範囲(見出し,説明)を指定できるようにした
* skinlfをやめて,metouiaに変更.
* look & feelで例外が発生していたバグを修正
* バグ修正(後方互換性を保つためのコードを追加)
* 以下の情報をプロジェクト情報として保存できるようになった(projectInfo.txt)
* 以下の情報をプロジェクト情報として保存できるようになった(projectInfo.txt)
* 平均兄弟数をプロジェクト情報として保存できるようにした
* 単語とIDの対応復元時に,利用可能でない辞書の概念と対応づけられている場合に,復元中に例外が発生していたのを修正
1形態素以上の文字列に対して部分照合した複合語を階層化する際に,概念の重複があったのを修正
以下の英語見出しをresourceファイルに記述
* ASWCスクリーンショット用に見た目英語で表示できるように,resourceファイルを記述
* ルートノードIDの修正
* DB使用時に自動多義性解消できなかったのを修正.
* 概念変動管理TRAで剪定された概念リストを提示できるようにした
* [重要]EDRを用いた概念定義で,定義域の取得がうまくできていなかったのを修正
主に,リファクタリングを行った.
* DisambiguationクラスのインナークラスであったConstructTreeActionクラスをactionsパッケージに移動した
* 剪定概念表示でルート概念は上位概念がないのでクリックすると例外が発生するのを修正.
* 複合語の階層化のバグを修正
* 抽象概念の見出しが空白文字で分断されていたのを修正
* [重要] 抽象概念の追加と複合語の剪定を同時に行う場合に,剪定前に抽象概念の追加を行っていたため,抽象概念数が実際よりも少なくなっていたのを修正
* DB版で階層構築時の入力概念の設定に不具合があったのを修正
* DB版で入力概念の設定に不具合があったのを修正
* 子ノードを2つ以上もたない抽象ノードが追加される場合があったのを修正
* バージョン(日付)を変更し忘れていたので修正
* Berkeley DB Java Editionのバージョンを2.1.30にアップ.
メニュー,オプション関連のリソースファイルを修正.
入力単語選択タブでテーブルから単語を選択する際に,処理に時間がかかっていたのを修正.
build/classes/resourcesを削除.
* 概念記述辞書についてもDBで扱うことができるようにした(30MBぐらいはメモリを節約できた)
多義性解消モジュールに入力単語を追加するためのボタンを追加
視覚化モジュール(MR3)と連携できるようにした
* プロパティの概念変動管理を視覚化できていなかったのを修正した
* 複数の概念を入力単語に対応させられるようにした
多義性解消パネルで入力単語の追加と削除をできるようにした
* 行為と移動概念以下の概念以外については,動詞的概念階層構築に反映できていなかったのを修正.
xdoc2txtのパスを指定できるようにした
英語化をすすめた
Matched Result Analysisの結果をソートして表示するようにした
* プラグイン起動時にスプラッシュウィンドウがうまく表示できていなかったのを修正
概念定義パネルで概念間の関係として,agentとobjectを選択できるようにした
stop word listを単語抽出時に無視できるようにした
視覚化モジュールからDODDLEに階層を反映させる時に,DODDLE側で選択している階層が視覚化モジュールで修正された場合に例外が発生していたのを修正
* ステーバスバーの表示に英語を追加
* 完全照合単語リストのみ保存した場合に,未知語が含まれる場合があったのを修正
概念間距離(活性拡散のようなアルゴリズム)を用いた自動多義性解消を行うことができるようになった
バージョン情報を更新
TF, IDFの表示を小数点以下3桁までとした
文書がtxt形式の場合にも,保存時に.txtを付加していたのを修正.
完全照合単語リストの中で,部分照合単語リストから自動的に追加しているものがあったので,それらを区別できるようにした
BUGFIX
* 自動多義性解消がうまくいかない場合があったのを修正
多重継承の除去を概念変動管理としてできるようにした.
システムが追加した完全照合単語について,下位概念に置換するかどうかを多義性解消時に選択できるようにした.また,チェックされた概念は,階層構築時に下位概念に置換される.
BUGFIX
* 多義性解消パネルの文書中の入力単語を強調するパネルで,入力単語を赤色で表示できるようにした.
* 概念定義パネルで,WordSpaceとAprioriを実行した時にもプログレスバーに進歩状況を表示するようにした
WordSpaceとAprioriで,複数文書を処理する場合に,入力単語リストのうち処理対象としている文書に含まれている単語のみで共起性を取るように修正
* Java 6ベースに移行
* 入力単語選択パネルで削除した単語を別テーブルで保持することができるようにした
入力単語選択パネルで文書中の抽出されたキーワードをハイライトする機能を実装.TFが高いほど単語が大きく表示される.また,削除された単語は灰色となる.
OWL形式のオントロジーを参照可能にする部分の実装を進めた.
* IDベースからURIベースに変更
主にバグ修正.以下のバグを修正すれば,とりあえず,IDベースからURIベースへの移行はおおむね完了.
バグ修正をいくつか行った.
DODDLEStringTagger.javaとDODDLEToken.javaを実装したが,
NameSpaceTable.javaを削除.
* Jenaのバージョンを2.5にアップ
* プロジェクトファイルのエンコーディングをすべてUTF-8に変更した
* 概念定義の結果をプロジェクトとして保存できるようにした(復元不可)
* 入力文書選択パネル,入力単語選択パネル,多義性解消パネルにおける入力単語及び入力文書リスト更新にあわせて,概念定義パネルにおける入力概念及び入力文書リストを更新するようにした
* 概念定義のプロジェクトファイルを復元できるようにした
* オプション,プロジェクトファイル等をPropertiesクラスを用いて,保存,復元できるようにした