From 18 Jan, 2021 0:00 UTC: All services will be temporary unavailable for maintenance

Forums: 公開討議 (Thread #36534)

OED V.4全文コピペについて (2015-02-26 11:53 by kunio40 #75596)

大久保様

いつもEPWING化で大変お世話になっております。
このたび、御公開EPWING化ツールのgetall.uwsにより、OED V.4の全文コピペを試みましたところ、次のとおり、いずれも「・・・10秒待ちコピペ終了 コピペに失敗しました。終了します。」のアラームが出ます(OS: 7 Home Premium SP1、64ビット、メモリ: 4GB)。

waitmsec   20 20 50 50 70 70 120 120 170
BTN 10 20 10 20 10 20 10 20 10
アラームの 39 52 34 36 96 79 47 213 148
出るNo・語 aald aas aac aald abait abade aare abbilliment abasing

waitmsec   170 220 220 270 270 120
BTN 20 10 20 10 20 30
アラームの 86 53 37 92 53 44
出るNo・語 a-baffled aas aac abait aas aane

御多忙中のところ、誠に恐縮ですが、解決策を御教示賜れば幸甚に存じます。

Reply to #75596×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

Re: OED V.4全文コピペについて (2015-02-26 21:36 by ohkubo-k #75599)

こんにちは。

ご指摘の問題は、いままで全く起きたことがありませんでした。
私がこれまで試した環境は、Windows XP (32bit)とWindows 7(32bit)だけで、数時間連続コピペしているとOEDアプリが異常終了することはありましたが、最初の数十回で変なことが起きたことはありませんでした。
いま試しに、Windows 8.1 (64bit)で走らせたら、おそらくkunio40さまと同じく、最初の数十回のコピペを繰り返したところで、突如検索語入力欄に変な語が現れ(勝手にaad~のような変な文字列が入力されたことになり)、その数回後に「1秒待ちコピペ・・・」でエラー終了となりました。
お試しのようにかなりゆっくり目にしても効果ありませんでした。何度か繰り返しても、止まるところは異なるものの、数十回で終わってしまいました。

一つの可能性として、32bit/64bitで何かの振る舞いが異なる可能性があります。
UWSCアプリは64bit対応をうたっており、そもそも単純なキー入力やマウスクリックの繰り返し、クリップボードのテキスト取得など基本的な操作だけなので、アプリが32bit/64bitかは特に関係ないはずです(DLLの呼び出しのような複雑なことは何もしていません)。しかし、何かあるのかもしれません。OEDアプリ側も何かが変わるのかもしれません。

最新のUWSC 5.1.0フリー版のほかに、そのお試しシェアライセンス版、それで作った実行ファイル、さらには ちょっと古いバージョンでもいくつか試しましたが、Windows 8.1 (64bit)環境では、いずれも最初の数十回のコピペ後にエラー終了となりました。
UWSCの Windows XPの互換モードで動かしても効果ありませんでした。
なぜこんなことが起きるのか、見当もつきません。

現象の確認にしかなりませんが、もしkunio40さまが Windows の 32bit 環境をお持ちなら、そちらで試していただけないでしょうか。それで動くのだとしたら(私は数回完走しています。今回の問題は全く初めてです)、64bit環境ではうまく行かないということだけは分かるかと思います。

http://projectzephyr.sourceforge.jp/oed.html
の先頭にメモを追記しておきました。
何か思いついたら、またこちらに投稿します。

Reply to #75599×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

Re: OED V.4全文コピペについて (2015-02-28 08:23 by ohkubo-k #75611)

> いま試しに、Windows 8.1 (64bit)で走らせたら、おそらくkunio40さまと同じく、最初の数十回のコピペを繰り返したところで、突如検索語入力欄に変な語が現れ(勝手にaad~のような変な文字列が入力されたことになり)、その数回後に「1秒待ちコピペ・・・」でエラー終了となりました。
> お試しのようにかなりゆっくり目にしても効果ありませんでした。何度か繰り返しても、止まるところは異なるものの、数十回で終わってしまいました。

同じ環境で、
- Look up words from other applications のチェックを外す
- Bypass homepage on start-up のチェックを付ける
の設定を直したうえで(前回試したときは、一つ目のチェックが付いたままでした)、千件コピペを3回問題なく繰り替えし行えました。
やはりこの設定がキモのようです。
Reply to #75599

Reply to #75611×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

Re: OED V.4全文コピペについて (2015-02-26 22:13 by ohkubo-k #75600)

可能性として、UWSCに問題の原因があるのかもしれません。

https://www.autoitscript.com/site/autoit/
UWSCのように処理の繰り返しを自動実行できるAutoItというソフトで同じようなことをやってうまく行くのであればよいのですが・・・(初めから作り直しになるのでちょっと時間がかかりそうです)。

それでもだめならOEDアプリは64bit環境で振る舞いがなぜかおかしい、ということになり、それはちょっと手の打ちようがないかと思います(そもそも32bitアプリを64bit環境で動かしたときの問題となると、Windows側の問題となり、解決できないかもしれません)。
ううむ・・・
Reply to #75596

Reply to #75600×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

Re: OED V.4全文コピペについて (2015-02-27 09:51 by ohkubo-k #75603)

http://projectzephyr.sourceforge.jp/oed.html
の「【重要】OEDアプリの初期設定変更」を修正しました。

- Look up words from other applications のチェックを外す
- Bypass homepage on start-up のチェックを付ける

の2点を確認してください。どちらもデフォルトの逆になります。
全文コピペに成功していた環境でも、"Lookup up words from other applications"のチェックを付けると、コピペが数十回で失敗することを確認しました。
32/64bitの関係ではないようです。
いかがでしょうか。
この2つの設定は、実は非常に重要だったのでした。
Best Answer Reply to #75596

Reply to #75603×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

Re: OED V.4全文コピペについて (2015-03-01 01:12 by YOSHIO #75620)


大久保様:

いつもEPWINGでお世話になっております!ありがとうございます。

今回kunio40様が指摘された現象は僕の64BITのパソコンでも確認されました。
最初はOSを変えなきゃならないことになるかと思ってましたが、大久保様の最新の初期設定変更修正でOSをチェンジせずに済みそうで大変ありがたく思っております。ありがとうございます。

一つ別の話ですが、Bookself BasicをEPWING化する方法が下記のサイトで公開されています。
http://bookselfbasic.seesaa.net/article/270981932.html
もう何年も前の商品で、今となっては入手困難かと思っておりますが、もしもお手持ちでしたら、そのサイトの方法でEPWING化をなさっていただけたらと思います。

僕は手順通りに作成を試みてみたのですが、途中で今回最初にやってみたOED4.0のEPWING化と同じく、いくつかのキーワードでコピーした語釈の内容が検索語入力欄に勝手に転送されたり、同じ内容が複数回コピーされたりして、うまくいきませんでした。諦めきれず、今日まで引きずってきました。大久保様ご公開のスクリプトを拝見して、また希望が湧いてきて、勝手ながら投稿させていただきました。
ご迷惑をおかけして申し訳ありません。ご教授いただけたらと思います。
Reply to #75603

Reply to #75620×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

Re: OED V.4全文コピペについて (2015-03-01 10:16 by ohkubo-k #75622)

YOSHIOさま

> 最初はOSを変えなきゃならないことになるかと思ってましたが、大久保様の最新の初期設定変更修正でOSをチェンジせずに済みそうで大変ありがたく思っております。

私もOS依存の話でなさそうでとても安心しました。
今時、32bitでは動かないならともかく、64bitで動かないのはちょっと辛いですから。


> 一つ別の話ですが、Bookself BasicをEPWING化する方法が下記のサイトで公開されています。

残念ながら、私はその辞書を使ったことがありません。
ただ、UWCSのスクリプトは、まあOEDのと似たようなことをやっています。
一項目ずつ表示してコピペというのは同じなので、当然ですが。

「コピーした語釈の内容が検索語入力欄に勝手に転送されたり」については、Bookselfのアプリ設定で、クリップボードにコピーした内容を自動的に検索する機能がONになっていたりしないでしょうか。もしあればOFFにすると解決するかもしれません。
ブラウザとBookselfを起動して、ブラウザで表示されている語を何か選択してコピー(Ctrl-C)したら、自動的にその語が検索されたりするならONになっていそうです。

「同じ内容が複数回コピーされたり」については、OEDアプリでも非常に長い項目の場合、テキストコピーにちょっと時間がかかる(数百ミリ秒?)ことがあり、処理が間に合わず、前回のコピペ内容のままになったことがあります。OEDコピペでは待ち時間を変えながら何度かコピーを繰り返し、前回と異なる内容が取れたところで処理を進めるようにしています。しかし、お示しのBookselfのものではそうはなっていません。

動かしていないので何とも言えませんが、70~100行目当たりで、
SCKEY(idB, VK_RCTRL, VK_C) //本文をコピー
エラー判定サブルーチン
が3か所ありますが、「エラー判定サブルーチン」のあとに念のためCtrl-Cをもう一度入れておくとよいかもしれません。
SCKEY(idB, VK_RCTRL, VK_C) //本文をコピー
エラー判定サブルーチン
SCKEY(idB, VK_RCTRL, VK_C) //本文をコピー

エラー判定サブルーチンは、アプリがBUSY状態なら5秒待つようになっています。
PROCEDURE エラー判定サブルーチン
IFB STATUS(idB, ST_BUSY) = True THEN //エラー判定
SLEEP(5) //待機
ここは5秒も待たなくてもよいかもしれません。
もし、上のCtrl-C追加が効果があるなら、この待ち時間は減らしたほうが処理は早く終わると思います。

ところで、このスクリプトの中に「Shogakukan 1988.国語大辞典(新装版)ゥ小学館 1988.」とありました。全20巻で日本語最大規模のあの「日国」なのでしょうか?
  http://ja.wikipedia.org/wiki/%E6%97%A5%E6%9C%AC%E5%9B%BD%E8%AA%9E%E5%A4%A7%E8%BE%9E%E5%85%B8
だとしたら第2版でなくても、EPWINGにしたいところですね。
Reply to #75620

Reply to #75622×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

Re: OED V.4全文コピペについて (2015-03-01 14:56 by YOSHIO #75624)

大久保様

早速ご返事いただき、ありがとうございました。

まずはご報告ですが、僕もWin8.1 64bitの環境で、OED2のEPWING化に成功しました。素敵なスクリプトを開発・公開してくださってありがとうございます。



> 「コピーした語釈の内容が検索語入力欄に勝手に転送されたり」については、Bookselfのアプリ設定で、クリップボードにコピーした内容を自動的に検索する機能がONになっていたりしないでしょうか。もしあればOFFにすると解決するかもしれません。
> ブラウザとBookselfを起動して、ブラウザで表示されている語を何か選択してコピー(Ctrl-C)したら、自動的にその語が検索されたりするならONになっていそうです。
>
> 「同じ内容が複数回コピーされたり」については、OEDアプリでも非常に長い項目の場合、テキストコピーにちょっと時間がかかる(数百ミリ秒?)ことがあり、処理が間に合わず、前回のコピペ内容のままになったことがあります。OEDコピペでは待ち時間を変えながら何度かコピーを繰り返し、前回と異なる内容が取れたところで処理を進めるようにしています。しかし、お示しのBookselfのものではそうはなっていません。
>
> 動かしていないので何とも言えませんが、70~100行目当たりで、
> SCKEY(idB, VK_RCTRL, VK_C) //本文をコピー
> エラー判定サブルーチン
> が3か所ありますが、「エラー判定サブルーチン」のあとに念のためCtrl-Cをもう一度入れておくとよいかもしれません。
> SCKEY(idB, VK_RCTRL, VK_C) //本文をコピー
> エラー判定サブルーチン
> SCKEY(idB, VK_RCTRL, VK_C) //本文をコピー
>
> エラー判定サブルーチンは、アプリがBUSY状態なら5秒待つようになっています。
> PROCEDURE エラー判定サブルーチン
> IFB STATUS(idB, ST_BUSY) = True THEN //エラー判定
> SLEEP(5) //待機
> ここは5秒も待たなくてもよいかもしれません。
> もし、上のCtrl-C追加が効果があるなら、この待ち時間は減らしたほうが処理は早く終わると思います。
>
ご指摘いただいたとおりにやってみます。何か結果が出たらまた御報告いたします。


> ところで、このスクリプトの中に「Shogakukan 1988.国語大辞典(新装版)ゥ小学館 1988.」とありました。全20巻で日本語最大規模のあの「日国」なのでしょうか?
>   http://ja.wikipedia.org/wiki/%E6%97%A5%E6%9C%AC%E5%9B%BD%E8%AA%9E%E5%A4%A7%E8%BE%9E%E5%85%B8
> だとしたら第2版でなくても、EPWINGにしたいところですね。

>御明察の通り、「日国」第二版です。マイクロソフト社が何年前に開発し発売したものですが、貴重な資料なので、ずっと重宝してありがたく使わせていただいております!

>僕が持っているのはBasic版で、以下の辞書が入っております。(BookshelfのReadmeからの引用です)

内容について

Bookshelf は、以下の 3 種類の書籍をもとに作成されています。

国語大辞典(新装版)(C) 小学館 1988.
プログレッシブ英和中辞典 (第 3 版) (C) 小学館 1980,1987,1998.
プログレッシブ和英中辞典 (第 2 版) (C) 小学館 1986,1993.

収録されている項目の内容は、それぞれの書籍の出版年時点での最新情報に基づ
いていますので、1998 年現在では、政治、人物、科学などのデータで更新が必
要となるものもありますが、原則として原典となった書籍の内容を忠実に収録し
ていますのでご了承ください。

>Basic版のほかに、完全版も発売されていたようですが、内蔵の辞書としては、上記三冊のほかに、次の辞書も加わっています(また、引用です)。

Bookshelf 2.0 は、Bookshelf Basic 2.0 の内容を完全に含んでいるばかりでなく、
『英英辞典』『故事ことわざの辞典』『類語例解辞典』『データパル』を加えた統合辞典です。ワープロなどと連携する画期的なQuickShelf機能も搭載しております。
そのまま、Bookshelf 2.0をお使いいただくことをお勧めします。

>どちらも大変貴重な辞書なので、EPWING化できなくても使い続けていこうと思います。もしも大久保様のお蔭で、EPWNG化できたらどんなに幸せかと、今は妄想中で。

Reply to #75622

Reply to #75624×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

Re: OED V.4全文コピペについて (2015-03-01 18:20 by ohkubo-k #75630)

YOSHIOさま

> まずはご報告ですが、僕もWin8.1 64bitの環境で、OED2のEPWING
化に成功しました。

いや、良かったです。Options設定さえちゃんとやれば、問題
なさそうですね。

> >御明察の通り、「日国」第二版です。マイクロソフト社が何年前に開発し発売したものですが、貴重な資料なので、ずっと重宝してありがたく使わせていただいております!

なな、なんと!!!信じられません!!
せいぜい3千円くらいの普通サイズの国語辞典だろうなと、いやでもひょっとして?と思っていました。
EPWING化はともかく、これは現物をなんとか手にしたいところです。時間がたつほど見つからなくなりそうですし、こういうもの(CD形式での辞書提供)は、今後もう二度と出ないでしょうし。
http://pc.watch.impress.co.jp/docs/article/980303/ms.htm
当時1万円程度だったようですね(安すぎる!)。
秋葉原の裏通りとか神保町とかに転がっていないものか・・・・

http://ja.wikipedia.org/wiki/Microsoft_Bookshelf_Basic
これによると、3.0では普通の国語&英和・和英で、1.0か2.0がねらい目ですね。
Reply to #75624

Reply to #75630×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

Re: OED V.4全文コピペについて (2015-03-07 09:45 by koiwai #75673)

> http://ja.wikipedia.org/wiki/Microsoft_Bookshelf_Basic
> これによると、3.0では普通の国語&英和・和英で、1.0か2.0がねらい目ですね。

横入りですみません。
Boookshelf 付属の国語大辞典は、以下の、新装版ではなかったでしょうか?
⇒『日本国語大辞典』(初版・全20巻)から約25万項目を抽出した簡略版。
http://www.amazon.co.jp/%E5%9B%BD%E8%AA%9E%E5%A4%A7%E8%BE%9E%E5%85%B8-%E5%B0%9A%E5%AD%A6%E5%9B%B3%E6%9B%B8/dp/4095010029

これであれば、小学館『DVD-ROM版 スーパー・ニッポニカ2001 日本大百科全書+国語大辞典』のものと同じかもしれません。
http://members.jcom.home.ne.jp/2141138101/Edic/pdic2edic/kokugo.htm

こちらであれば、スーパーニッポニカToolkit (by hishida様)でepwing変換可能です。
Reply to #75630

Reply to #75673×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

Re: OED V.4全文コピペについて (2015-03-01 10:12 by kanapin #75621)

大久保 様

はじめまして。いつもお世話になっております。
私もコピペに失敗しておりましたが、2月27日にご追記いただいた初期設定変更で
試みたところ、
無事成功しました(Macの仮想OSアプリを使って、64bit Win7で実行しました)。
ありがとうございました。

[メッセージ #75603 への返信]
> http://projectzephyr.sourceforge.jp/oed.html
> の「【重要】OEDアプリの初期設定変更」を修正しました。
>
> - Look up words from other applications のチェックを外す
> - Bypass homepage on start-up のチェックを付ける
>
> の2点を確認してください。どちらもデフォルトの逆になります。
> 全文コピペに成功していた環境でも、"Lookup up words from other applications"のチェックを付けると、コピペが数十回で失敗することを確認しました。
> 32/64bitの関係ではないようです。
> いかがでしょうか。
> この2つの設定は、実は非常に重要だったのでした。
Reply to #75603

Reply to #75621×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

Re: OED V.4全文コピペについて (2015-03-01 13:48 by ohkubo-k #75623)

ご連絡ありがとうございます。初の成功のご報告です!
やはりあの設定だったのですね。
気付かずに公開してしまい、すみませんでした。
Reply to #75621

Reply to #75623×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

Re: OED V.4全文コピペについて (2015-03-03 05:24 by kunio40 #75638)

[メッセージ #75603 への返信]
大久保様
解決策の御教示誠にありがとうございます。
確かに、 - Look up words from other applicationsにチェックが付いておりました。
御教示のOptions設定に基づき、64ビット版は9回(waitmsec=50、BTN=20)、32ビット版(Vista Home Premium SP2、メモリ:2GB)は5回(waitmsec=120、BTN=10)、前回と同じ現象が生じるため、「途中からコピペ再開」で全文コピペに成功いたしました。
なお、OEDのバージョンが「4.0」のためか、HTMLに変換の際、両OSとも「WARN: &#xFEFF=? is not in GaijiMap.xml」のアラームが出ますが、EBWin4での検索は問題ないようです。
確認に手間取り、御報告が遅れましたことをおわび申し上げます。
大久保様の偉業に改めて感服いたします。

> http://projectzephyr.sourceforge.jp/oed.html
> の「【重要】OEDアプリの初期設定変更」を修正しました。
>
> - Look up words from other applications のチェックを外す
> - Bypass homepage on start-up のチェックを付ける
>
> の2点を確認してください。どちらもデフォルトの逆になります。
> 全文コピペに成功していた環境でも、"Lookup up words from other applications"のチェックを付けると、コピペが数十回で失敗することを確認しました。
> 32/64bitの関係ではないようです。
> いかがでしょうか。
> この2つの設定は、実は非常に重要だったのでした。

Reply to #75603

Reply to #75638×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

Re: OED V.4全文コピペについて (2015-03-03 09:49 by ohkubo-k #75640)

kunio40さま

何はともあれ、完走おめでとうございます。よかったです。お疲れ様でした。

> 御教示のOptions設定に基づき、64ビット版は9回(waitmsec=50、BTN=20)、32ビット版(Vista Home Premium SP2、メモリ:2GB)は5回(waitmsec=120、BTN=10)、前回と同じ現象が生じるため、「途中からコピペ再開」で全文コピペに成功いたしました。

しかし、うむむ、やはりなにか引っかかっているようですね。。。
なお、昨晩 OED の 4.0 -> 4.0.0.3 アップデートについて
 http://projectzephyr.sourceforge.jp/oed.html
に追記ました。メール問い合わせで更新版を送ってもらえるようです。
4.0 ですと、節見出しがコピペでダブる (1.a のはずが 1.a.1.a とかになる??)ようです。
http://global.oup.com/uk/academic/cdromsupport/oed2v4_0/#7

> なお、OEDのバージョンが「4.0」のためか、HTMLに変換の際、両OSとも「WARN: &#xFEFF=? is not in GaijiMap.xml」のアラームが出ますが、EBWin4での検索は問題ないようです。

ShiftJISに無い文字は GaijiMap.xml にEPWINGの外字としてすべて登録済みです。
私が使った 4.0.0.3では HTML でいう  の文字
 http://www.fileformat.info/info/unicode/char/feff/index.htm
は出てきませんでしたので GaijiMap.xml には登録していません。
このため、UTF-8 から ShiftJIS に変換する際、GaijiMap.xml にない文字が使われているぞ!と警告メッセージが出たわけです。

ひょっとして、UWSCで出来た oed-xx.txt をWindows のメモ帳で編集・保存されたでしょうか?メモ帳は保存する際に、必ずBOMと呼ばれる制御コードを追加してしまいます。
これが  に相当します。Windowsのメモ帳以外では一般に付かないものです。
もしかすると、oed-xx.txt の一番先頭にある項目の見出し語が正しく検索で見つからないかもしれません。
もしそういう項目(oed-xx.txt)がありましたら、たとえば秀丸エディタで UTF-8 のBOM無しで保存してみてください。
http://hide.maruo.co.jp/software/hidemaru.html
http://hidemaruo.mydns.jp:81/helpsite/hidemaru/html/130_CmdFile_Encode.html

特にメモ帳で保存されていなかったのでしたら、本当に OED 4,.0 のテキストには  の制御コードがどこかに混じっているようです。
私のJava変換プログラムの方で  を取り除くようにしておく方が無難そうですね。
Reply to #75638

Reply to #75640×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

Re: OED V.4全文コピペについて (2015-03-03 17:33 by kunio40 #75647)

[メッセージ #75640 への返信]
大久保様

詳細なアドバイスを賜り、誠にありがとうございます。

> しかし、うむむ、やはりなにか引っかかっているようですね。。。
> なお、昨晩 OED の 4.0 -> 4.0.0.3 アップデートについて
>  http://projectzephyr.sourceforge.jp/oed.html
> に追記ました。メール問い合わせで更新版を送ってもらえるようです。
> 4.0 ですと、節見出しがコピペでダブる (1.a のはずが 1.a.1.a とかになる??)ようです。
> http://global.oup.com/uk/academic/cdromsupport/oed2v4_0/#7

ぜひアップデートしたいと存じます。

> ShiftJISに無い文字は GaijiMap.xml にEPWINGの外字としてすべて登録済みです。

ochlotic, a.では、
ὄχλος とあるべきところ、ὄχλο?
と一部文字化けが見られます。

> 私が使った 4.0.0.3では HTML でいう  の文字
>  http://www.fileformat.info/info/unicode/char/feff/index.htm
> は出てきませんでしたので GaijiMap.xml には登録していません。
> このため、UTF-8 から ShiftJIS に変換する際、GaijiMap.xml にない文字が使われているぞ!と警告メッセージが出たわけです。
>
> ひょっとして、UWSCで出来た oed-xx.txt をWindows のメモ帳で編集・保存されたでし>ょうか?メモ帳は保存する際に、必ずBOMと呼ばれる制御コードを追加してしまいます。
> これが  に相当します。Windowsのメモ帳以外では一般に付かないものです。

御明察のとおり、メモ帳で編集・保存いたしました。

> もしかすると、oed-xx.txt の一番先頭にある項目の見出し語が正しく検索で見つからな>いかもしれません。
> もしそういう項目(oed-xx.txt)がありましたら、たとえば秀丸エディタで UTF-8 のBOM>>無しで保存してみてください。
> http://hide.maruo.co.jp/software/hidemaru.html
> http://hidemaruo.mydns.jp:81/helpsite/hidemaru/html/130_CmdFile_Encode.htm>l

念のためメモ帳で編集・保存したファイルをチェックしましたが、正しく検索できました。

> 特にメモ帳で保存されていなかったのでしたら、本当に OED 4,.0 のテキストには &#x>FEFF; の制御コードがどこかに混じっているようです。
> 私のJava変換プログラムの方で  を取り除くようにしておく方が無難そうですね。

貴プログラムの変更には及びません。

Reply to #75647×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

Re: OED V.4全文コピペについて (2015-03-03 22:30 by ohkubo-k #75648)

> ochlotic, a.では、
> ὄχλος とあるべきところ、ὄχλο?
> と一部文字化けが見られます。

申し訳ありません。これは私のバグでした。修正版を仮に
 https://sourceforge.jp/projects/projectzephyr/downloads/62915/oed2v4-150303.zip/
にアップしました。もろもろのファイルを上書き更新のうえ、makehtml.bat と EBStudio 処理を再実行して頂けますでしょうか。全文コピペの再実行は必要ありません(よかった・・・・・・)。
当方の環境では
 https://sourceforge.jp/ticket/download.php?group_id=7237&tid=34951&file_id=5178
ςがちゃんと表示されるようになりました。

UTF8 -> ShittJIS の変換で、ASCII 文字やギリシャ文字などは、&#x...; に変換不要な文字としていました。しかし、α~ζはShiftJISにあるものの、その途中にある語末のシグマ(ς)だけはShiftJISにはない文字で、ς と変換しなければならないのでした。これが抜けていたため、ςが?になっていました。
UTF8 -> ShiftJIS 変換プログラム(zephyr.jarに含まれます)を修正し、外字設定ファイルをすべて修正しました(半角外字の最後にςを追加しました)。

ついでながら、  の文字も何らかの事情で混入する可能性があるので、makehtml.bat実行中に除外するようにしました。
Reply to #75647

Reply to #75648×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login

Re: OED V.4全文コピペについて (2015-03-04 11:10 by kunio40 #75651)

[メッセージ #75648 への返信]
大久保様

御多忙中のところ、修正版をアップロードしていただき、誠にありがとうございます。

> 申し訳ありません。これは私のバグでした。修正版を仮に
>  https://sourceforge.jp/projects/projectzephyr/downloads/62915/oed2v4-150303.zip/
> にアップしました。もろもろのファイルを上書き更新のうえ、makehtml.bat と EBStudio 処理を再実行して頂けますでしょうか。全文コピペの再実行は必要ありません(よかった・・・・・・)。
> 当方の環境では
>  https://sourceforge.jp/ticket/download.php?group_id=7237&tid=34951&file_id=5178
> ςがちゃんと表示されるようになりました。

御教示の手順でやり直したところ、間違いなく表示されました。

> UTF8 -> ShittJIS の変換で、ASCII 文字やギリシャ文字などは、&#x...; に変換不要な文字としていました。しかし、α~ζはShiftJISにあるものの、その途中にある語末のシグマ(ς)だけはShiftJISにはない文字で、ς と変換しなければならないのでした。これが抜けていたため、ςが?になっていました。
> UTF8 -> ShiftJIS 変換プログラム(zephyr.jarに含まれます)を修正し、外字設定ファイルをすべて修正しました(半角外字の最後にςを追加しました)。
>
> ついでながら、  の文字も何らかの事情で混入する可能性があるので、makehtml.bat実行中に除外するようにしました。

おかげさまで、アラームが出なくなりました。
取り急ぎ御礼まで。

Reply to #75648

Reply to #75651×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login