
Ubuntu日本語フォーラム

ログインしていません。
synapticにあったchasenをインストールしたのですが、起動のしかたが分かりません。知っている方がいましたら教えてください。(READ MEを読んだのですが、分かりませんでした。)
オフライン
yamadatarou による投稿:
synapticにあったchasenをインストールしたのですが、起動のしかたが分かりません。知っている方がいましたら教えてください。(READ MEを読んだのですが、分かりませんでした。)
私はmecabを使用しているので茶筅はよく知らないのですが、端末から
chasen 入力ファイル
で形態素解析できます。
ただ、標準がeuc-jpみたいで文字化けしますけども。
オフライン
すいません、試してみたのですがchasen: can't open chasenrc or /usr/local/etc/chasenrc
と表示され形態素解析してくれません。だれか原因が分かる方教えてください。
オフライン
yamadatarou による投稿:
すいません、試してみたのですがchasen: can't open chasenrc or /usr/local/etc/chasenrc
と表示され形態素解析してくれません。だれか原因が分かる方教えてください。
設定ファイルが読めないと言ってきています。一度設定ファイルを削除してみてください。
オフライン
すいません、 /usr/local/bin/chasen-configのこのchasen-configが設定ファイルでしょうか?ちなみに /usr/local/etc/chasenrc を探したのですが、etcファイルがみつからず、分かりませんでした。
それで、削除しようと色々試したのですが、"/usr/local/bin/chasen-config" 自身またはその親フォルダに対する変更権限がないので移動できません。と表示され移動できず、ゴミ箱へ移動できません:アクセスが拒否されましたと表示され、ごみ箱にも捨てれません。お手数ですが、どうやったら削除できるか教えていただけますか?ネットで設定ファイルの削除を探したのですが、見付かりませんでした。
オフライン
※規約違反により追放されたユーザの投稿は、ログインユーザにのみ表示されます。
最後の編集者: kiyoshi (2008-07-25 12:53:31)
オフライン
情報を少し整理しましょう。
お使いのubuntuのバージョンは8.04ですか?
chasen -V としてバージョン表記がされますか?
もしされずにエラーが出るのならば、いったんアンインストールしてから再インストールしてみて下さい。その時にグローバルな設定ファイルが /etc/chasenrcにあるので、これも削除して下さい。
上記手順を踏んだのちに再インストールしてみて、chasen -Vしてみてバージョン表記が出たならインストールは問題なしです。
オフライン
使ってるubuntuのバージョンは6.06です。chasenを削除後再インストールしました後/etc/chasenrcを消しました。chasen -Vでバージョン表記はでましたが、状況は変わりませんでした。何を、どうすればいいのか・・・。手詰まりでしょうか?
オフライン
yamadatarou による投稿:
使ってるubuntuのバージョンは6.06です。chasenを削除後再インストールしました後/etc/chasenrcを消しました。chasen -Vでバージョン表記はでましたが、状況は変わりませんでした。何を、どうすればいいのか・・・。手詰まりでしょうか?
6.06でしたか。今度から質問なされるときは簡単な使用環境を書いておいて下さい。
#3 の状況を見るかぎり、設定ファイルの場所がわからないよと言っているか、もしくは設定ファイルの中身が間違ってて開けないよと言っているみたいです。
chasen -hでヘルプが出ますので、直接設定ファイルを指定するオプションを試してみてください。多分、
chasen -r 設定ファイル
だと思います。
これで動かないとなると、こちらは8.04で6.06の環境が手元にないのでこれ以上は確かめようもなく><
どなたか判る方におまかせしたいと思います。
オフライン
※規約違反により追放されたユーザの投稿は、ログインユーザにのみ表示されます。
最後の編集者: kiyoshi (2008-07-26 12:09:43)
オフライン
※規約違反により追放されたユーザの投稿は、ログインユーザにのみ表示されます。
最後の編集者: kiyoshi (2008-07-26 13:46:24)
オフライン
やりました!できました!一歩進みました!しかし、問題が・・・。
chase -r /etc/chasenrc でその後文章を入力すると形態素解析らしきものを行いました。しかし結果は
�� ̤�θ�
�� ̤�θ�
�� ̤�θ�
h ���å� h ����-�����ե��٥å�
�� ̤�θ�
�� ̤�θ�
�� ̤�θ�
�� ̤�θ�
� ̤�θ�
h ���å� h ����-�����ե��٥å�
�� ̤�θ�
�� ̤�θ�
�� ̤�θ�
r ������ r ����-�����ե��٥å�
EOS
と文字化けしてました。
いま思ったのですがもしかして /usr/local/etc/chasenrc といつも表示されるのですが、わたしのubuntu
にはlocalにetcはなく、etcはusrと同じ場所に存在します。このパスを変えれば普通に起動するのでしょうか?またこの文字化けもどうにかできないでしょうか?
オフライン
すいません、文字化けは端末の文字コード設定をEUC-JPに変更して対処できました。chasenrcやetcファイルの場所を変えることはできないようなので、読み込む時そのパスを変更できないものでしょうか?
オフライン
※規約違反により追放されたユーザの投稿は、ログインユーザにのみ表示されます。
最後の編集者: kiyoshi (2008-07-26 16:25:36)
オフライン
できました!
$ sudo mkdir /usr/local/etc
$ sudo ln -s /etc/chasenrc /usr/local/etc/chasenrc
で、localにetcファイルができて更にその中にchasenrcができて、端末にchasenと入力後文章いれれば形態素解析を行う状態になりました!ありがとうございます!!
しかし文字化けは変わらずです。chasen -hを以下に載せます。
ChaSen version 2.4.1 (c) 1996-2007 Nara Institute of Science and Technology
Grammar files are in ChaSen's new v-gram format.
Usage: chasen [options] [file...]
-s partial analyzing mode
(how to print ambiguous results)
-b show the best path (default)
-m show all morphemes
-p show all paths
(output format)
-f show formatted morpheme data (default)
-e show entire morpheme data
-c show coded morpheme data
-d show detailed morpheme data for Prolog
-v show detailed morpheme data for VisualMorphs
-F format show morpheme with formatted output
-Fh print help of -F option
(miscellaneous)
-i encoding character encoding.
e: EUC-JP, s: Shift_JIS, w: UTF-8, a: ISO-8859-1
-j Japanese sentence mode
-o file write output to `file'
-w width specify the cost width
-C use command mode
-r rc-file use rc-file as a chasenrc file other than the default
-R with -D, do not read chasenrc file, without -D, read the
default chasenrc file `/usr/local/etc/chasenrc'
-L lang specify languages
-O[c|s] output with compound words or their segments
-lp print the list of parts of speech
-lt print the list of conjugation types
-lf print the list of conjugation forms
-h print this help
-V print ChaSen version number
これをみて文字化けに対する対処が分かる方、すいませんお手数ですが教えて下さい。
オフライン
※規約違反により追放されたユーザの投稿は、ログインユーザにのみ表示されます。
オフライン
※規約違反により追放されたユーザの投稿は、ログインユーザにのみ表示されます。
最後の編集者: kiyoshi (2008-07-29 22:14:35)
オフライン
kiyoshi による投稿:
ちなみに、#11の方法は、端末でInteractiveに文章を入力するのではなく、あらかじめ作成された日本語文のテキストファイルを指定する方法です。
端末から対話的に入力しつつ nkf を通すならば
$ nkf --euc | chasen | nkf --utf8
みたいなやり方も。入力の終了は例によって C-d で。
オフライン
yamadatarou@yamadatarou-laptop:~$ chasen -i w
chasen: /usr/share/chasen/dic/ipadic/cforms.cha:9-21: no basic form
と表示され、うまく文字の変換がされないようです。
これは・・・?分からない自分が悲しい・・。no basic form・・・。つまり、cformに何かが無いということでしょうか?
オフライン
※規約違反により追放されたユーザの投稿は、ログインユーザにのみ表示されます。
最後の編集者: kiyoshi (2008-07-29 19:47:36)
オフライン
※規約違反により追放されたユーザの投稿は、ログインユーザにのみ表示されます。
オフライン