up:: PowerShell_and_Command-Line
xpdf-tools
scoopからダウンロードしたけど起動しない
xpdfは複数のファイルの集合体。
scoop catで読むと分かるが、そのファイルにそれぞれパスが通されている。よって打ち込むべきはそのファイル名。.exe部分は要らない。
日本語が変換できない
設定が必要。
lsp(language support)を入れ、日本語設定ファイルをダウンロード。
中のadd-to-xpdfrc
をxpdfの使うファイルと同じ階層に入れ、名前をxpdffrc
に変更。
xpdffrc
を開き、内部のリンクを絶対パスで修正。ぶっちゃけUTF-8しか使わないだろうしCMapだけ設定しとけばいい気もする。
あとは-enc Shift-JIS
などとして変換すれば行ける。
utf-8でも-enc UTF-8
としないと変換してくれない。
PDFからテキストを抽出する - ふなWiki
Xpdf:コマンドラインのPDFツール | PDF
xpdfrc(5)
XpdfReaderでPDFから日本語を抽出する方法(さくらのレンタルサーバ) - Qiita
うまく改行しない
知らん。
windowsなら-eol dos
で多少ましになる。