お知らせ

  • 利用規約を守って投稿してください。また、よくある質問および投稿の手引きも参照してください。
  • メッセージの投稿にはアカウントが必要です。未登録の方は、ユーザ登録ページからアカウントを作成することができます。

#1 2016-05-30 13:38:24

hoge
メンバ
登録日: 2016-05-20

Webスクレイピングwo

お世話になります。初心者です。
何卒よろしくお願いいたします。

htmlファイルを保存したいと思っています。
   

wget -r -l 1 http://www.※※※.com/

と端末に入力したところ、カレントディレクトリに※※※.comが作成され、
その中に
index.html と
Data1.html と
Data2.html と
Data3.html が
ありました。

Data2.htmlだけをDesktop/htmlディレクトリに取得し、
Data2.htmlをwgetコマンドを実行した時の年_月_日_時:刻:秒.htmlに変更したいです。
wgetコマンド1行で実行するにはどうしたらいいでしょうか。

どなたかご教授くださいますようよろしくお願いいたします。

オフライン

 

#2 2016-05-30 16:57:09

ry
メンバ
登録日: 2008-07-30

Re: Webスクレイピングwo

hoge による投稿:

wget -r -l 1 http://www.※※※.com/

と端末に入力したところ、カレントディレクトリに※※※.comが作成され、
その中に
index.html と
Data1.html と
Data2.html と
Data3.html が
ありました。

Data2.htmlだけをDesktop/htmlディレクトリに取得し、
Data2.htmlをwgetコマンドを実行した時の年_月_日_時:刻:秒.htmlに変更したいです。
wgetコマンド1行で実行するにはどうしたらいいでしょうか。

これでどうかな。

wget -nd -P Desktop/html -O "$(date '+%Y_%m_%d_%H:%M:%S').html" http://www.example.com/Data2.htm

蛇足: man wget と man date をじっくり読むことをお勧めします。

オフライン

 

#3 2016-06-01 15:27:14

hoge
メンバ
登録日: 2016-05-20

Re: Webスクレイピングwo

ryさん

重ね重ねご丁寧にご指導いただきまして
大変勉強になっております。
本当にありがとうございます。

ryさん による投稿:

wget -nd -P Desktop/html -O "$(date '+%Y_%m_%d_%H:%M:%S').html" http://www.example.com/Data2.htm

を参考にさせていただき、

wget -r -l1 -nd -P Desktop/html/1_吉田 -O "$(date '+%Y_%m_%d_%H:').html" http://※※※.com/

と入力したところ、
Desktop/html/1_吉田
の中は空のままで、
Desktop/html
の中に
年_月_日_時:.html
が作成されました。
Desktop/html/1_吉田

は作成済みです。

保存先のディレクトリの指定の仕方に間違いがあると思うのですが
Desktop/html/1_吉田
を保存先のディレクトリにするには
コマンドをどのように修正すればいいでしょうか

また、マニュアルを読もうと思い、

man wget

と入力したところ、
英語で表示されました。
日本語にする方法はありますか?

重ね重ね申し訳ありませんが、
何卒よろしくお願いします。

オフライン

 

Board footer

Powered by FluxBB