オンラインでリソースを検索して入手した書籍にはしばしば目次が含まれておらず、目次がある場合でも文字化けしていることがあります。この問題を解決するために、このチュートリアルを作成しました。
大まかに以下のような状況に分けることができます:
-
目次ブックマークがない場合
-
目次ブックマークにはページ番号のみがある場合
-
目次ブックマークが文字化けしている場合
大まかに言えば、目次の追加は次の 3 つのステップに分けることができます:1. 目次の検索、2. 目次の入力、3. 目次ブックマークの挿入。
以下のチュートリアルは PDF ファイルの使用に限定されています。
一、目次の検索#
一部の書籍には目次が付属していますが、一部の書籍には目次が含まれていません。
- まず、全国図書館参考資料連盟にログインして書籍を検索できます。
翦商を例に説明します:
右上の目次ページに注意してください
注意:図書館参考資料連盟で書籍を見つけることができ、かつその書籍が新しい出版物でない場合、ss 番号を使用して目次を迅速に取得することができます。詳細は第 2 部を参照してください。
- 豆瓣、淘宝、京東などで検索することもできます。
孔夫子旧書網
豆瓣
淘宝
京東
- 百度百科、ウィキペディアなどで運試しをするか、京東や淘宝で誰かが目次ページをアップロードしていないかを探すこともできます。
それでも見つからない場合は、手動で入力するしかありません。その場合は第 2 ステップと組み合わせて確認する必要があります。
二、目次の入力#
-
手動入力は、いつでも信頼できる手段です。まるで 11 番のバスのようです。
-
ss 番号を使用して入手する場合は、図書館参考資料連盟と組み合わせて使用し、ブックマーク取得ツール(https://wwgz.lanzoue.com/i74lM1cs6qx パスワード:73bp)をダウンロードし、ss 番号を入力してすべて選択してコピーします。ほとんどの場合、目次は整理されていますが、微調整が必要な場合もあります。
ss 番号は、目次ページの base の後にある数字です。
15190286 が ss 番号です
注意:ブックマークツールはウイルスとして報告される場合があります。
欠点:一部の書籍ではブックの概要がないため使用できず、新しい書籍では ss 番号を使用できません
-
コピー&ペーストは、PDF ドキュメントをコピーできる場合、ドキュメントの内容を直接 Word に貼り付けます。
-
OCR 入力は、画像やドキュメントを基にして使用しますが、特に適したソフトウェアを見つけることができませんでした。ここでは、Quicker ソフトウェアのスクリーンショット OCR アクションをおすすめします。設定で API を調整できますが、Baidu API と Tencent API の両方を使用できます。
注意:Quicker のテキストボックス内で整理することができ、正規表現を使用して整理を完了することができます。
欠点:スクリーンショット OCR アクションは、目次を認識する際に常に目次の末尾の数字を次の行に認識してしまうため、手動で調整する必要があります。
- PDF 変換は、やや複雑で要件も多いです。
(1)まず、PDF を分割し、目次(ある場合)を別の PDF として保存します。3 つの方法があります。
A. Quicker アクションの分割を使用して、元のファイルを分割します。
B. Split PDFにアクセスし、Extract pages オプションを選択し、目次ページを選択して Extract をクリックし、最後にダウンロードします。(注:PDF ファイルのサイズは 100MB を超えることはできません。IDM を使用してダウンロードする必要があります)
B. PDFPatcherをダウンロードし、オープンした後、PDF ファイルを選択し、ツールボックスをクリックし、ドキュメントの内容を抽出し、ドキュメントを分割し、PDF のパスと出力パスを選択し、適切なページ範囲を入力し(図のように)、最後に抽出します。
実際のページに基づいてページ範囲を設定してください
(2)PDF を変換し、PDF ファイルを ABBYY Fine reader(バージョン 16 をおすすめします。バージョン 15 では精度が不足しています)を使用して検索可能なファイルに変換します。
すべて選択してコピーします
(3)取得した目次を Word に貼り付け、ワイルドカードを使用して整理し、空白行、空白スペース、不要なテキスト、ページ番号などを削除します。整理後、各行の形式は章、目次のタイトル、ページ番号の順になります。
注意:(章とタイトルの間にはスペースを追加する必要があり、展開可能な目次ブックマークを作成するにはタブを追加する必要があります)
例 1
例 2
三、目次ブックマークの挿入(重要)#
- pdgcteditor ソフトウェアをダウンロードします。ブログ内でダウンロードできます。
strnghrs - 博客园
老马的原创空间
- pdgcteditor.exe を開き、PDF ファイルを選択し、整理した内容を貼り付けてすべて選択し、自動的にページ番号を分割し、基準ページを変更し、保存をクリックします。
順番
ページ番号を分割した後の状況
基準ページは、ページ番号の最初のページの実際のページです。(最初のページは状況によって異なりますが、目次、序文、本文のいずれかになる可能性があります)
- 実際の効果のデモ:
特殊な場合:
PDF が編集できない場合があります
対処方法:pdfdirをダウンロードして開き、PDF を選択し、Word の内容を貼り付け、書き込みをクリックすると、*_new.pdf ファイルが得られます。その後、pdgcnteditor で目次ブックマークを編集し直すことができますが、原理は不明です。強制的に書き込む可能性があります。
まとめ:書き終わった後、本当に疲れました。まだ慣れていないので、ご了承ください。最初はマウスが動かなくなったり、マウスポインターが漂流したり、削除キーが常に 2 つ戻ったりすることがありました。これはブログを書く過程でいつもイライラしていましたが、拡張機能を閉じると問題が解決しました。この問題は以前、知乎や豆瓣で何かを書くときによく起こり、プラットフォームの問題だと思っていましたが、今気づいたのは拡張機能の問題です。心が疲れました。