PCでエロ画像を集めてたんですが、ふと思った。
めんどい!
スマホだとガゾロイドが便利だったけど、更新停止しちゃったし。
そんなわけでRubyを使って自動収集ツールでも作ろうかと思い立ちました。
(一応攻撃にならないようディレイは長めに取ります)
あ、技術的な話はしません。素人も素人なんで。知りたい人はググれ。
出てきたサンプルコードを元に頑張れば素人でも行ける! はず!
特に参考になったページと引っかかったところだけメモ。
お世話になったぺージ
Anemoneによるクローラー入門 | feedforce Engineers' blog
RDoc Documentation(anemoneのDocument)
rubyでRSS情報を取得 (自分用のRSS reader作成に向けて) | rakkyooの備忘録
imgタグの相対パスを絶対パスに変換するには? - QA@IT(コメントのStack Overflowの部分)
・Windows版Rubyでanemone動かしたいなら、バージョンは2.0.0で
anemoneで使ってるnokogiriがWindows版最新Rubyに対応していないため。
・anemoneで取得した文字列の化け対策
エロ画像をぺージ毎にフォルダ分けしたかったのでタイトルを持ってきたかったが、
anemoneで作成されたnokogiri docから取得するとUTF-8以外の2byte文字が化ける。
Ruby製のクローラー Anemoneの文字化け対策 - プログラマになりたい
↑上記サイトを参考に対策済み。
抜本的対応と対症療法的対応があって、Gitが使えれば抜本的対策をしたかったのだが、
残念ながら素人でしてGitとか使ったことないので対症療法で。
とか最初はanemoneでやってたけど、大半のサイトはanemoneのクローリングよりもRSSの方が良いね……。
あとはViXと組み合わせれば、疑似ガゾロイドとして十分に使えるなー。
ふぃー、頑張った。
エロの力は偉大だ。
あ、Androidを最近弄ってるのは、この機能をスマホでやりたいなーと思い立ったからでした。
ガゾロイドが発端で、Rubyで似たものをつくり、結局またAndroidに戻る形。
やっぱエロ画像の収集と選別はAndroidの方が便利なんだなぁ。