科学の箱

科学・IT・登山の話題

Ruby

rubyを使ってスクレイピング

投稿日:

とりあえず動くコード

fastlist.rb

 # coding: utf-8
 require 'rubygems'
 require 'mechanize'
 require 'kconv'

 #url = ARGV[0]
 agent = Mechanize.new
 # agent.get(url)

 open("list.txt", "w") do |f|
   load("minato-ku.rb")
 end

minato-ku.rb

 # coding: utf-8
 require 'rubygems'
 require 'mechanize'
 require 'kconv'

 agent = Mechanize.new
 agent.get('http://www.lib.city.minato.tokyo.jp/j/guide1.html')
 agent.page.search("div[@class='lib_list']>div[@class='lib']>a").each do |target_link|
     #DBG puts target_link.inner_text
     #DBG puts target_link['href']
     agent.get(target_link['href'])
     puts agent.page.title, agent.page.uri
     agent.page.search("div[@class='eventlist']").each do |el|
        el.search("div[@class='event']").each do |evt|
          puts evt.text
        end
     end
   end

メタ情報

inarticle



メタ情報

inarticle



-Ruby
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

Rubyをインストールする

Ruby環境はrbenvで構築するとバージョン管理が楽になる。 rbenvのインストール こちらを参考にしてrbenvをインストールする gitからrbenvを取得する。 # git clone ht …

no image

Ruby on RailsをWindowsにインストールする

ドットインストールでRuby on Railsを勉強してるが環境設定でつまづいた。正確にはインストールはされるのだがプロジェクトを作ろうとするとエラーが出て落ちる。SSL関連のエラーでgoogleで調 …

no image

chefのインストール

chefのインストールで思いっきりはまってしまった。結論から言うと、手順に問題があったのではない。バージョンの縛りがきつかった。 成功した環境 ruby 1.9.3p429 gem 1.8.23 ch …

no image

gem ssl error

gem install chef –no-ri –no-rdoc ERROR:  Could not find a valid gem ‘chef’ ( …

no image

sudoとrbenvの関係

rbenvでglobalバージョンを変えてもsudoをするとsystemバージョンが使われる。 gemでsudoをしてしまうとsystemバージョンに沿ったモジュールがインストールされてしまうために、 …

2014年9月
« 8月   10月 »
1234567
891011121314
15161718192021
22232425262728
2930  

side bar top



アーカイブ

カテゴリー