get_linksは便利だが文字列を指定する際に少々手間取った。
結論から言うと文字列で指定する方法とre.compileオブジェクトを指定する方法の2つがある。
まず一つ目は単純な文字列。exact matchでなくてもよいがwild card等は使えない。
links = Browser.get_links('次') # This is OK
それに対して正規表現が使えるのが下記指定方法
links = browser.get_links(re.compile('.*次'))
科学・IT・登山の話題
投稿日:2018年10月31日 更新日:
get_linksは便利だが文字列を指定する際に少々手間取った。
結論から言うと文字列で指定する方法とre.compileオブジェクトを指定する方法の2つがある。
まず一つ目は単純な文字列。exact matchでなくてもよいがwild card等は使えない。
links = Browser.get_links('次') # This is OK
それに対して正規表現が使えるのが下記指定方法
links = browser.get_links(re.compile('.*次'))
執筆者:admin
関連記事
seabornを利用すれば基本となるビジュアルと分布、regressionをすぐに取得できる。 import seaborn as sns tips = sns.load_dataset(‘tips’ …
概要 ここでは以下の項目について取り扱う 軸にラベルを設定する ー xlabel, ylabel 軸の最小値、最大値を設定する ー xlim, ylim, xaxis 軸にメモリを設定する ー xti …
スクレイピングをするプログラムを開発するときに対象となる項目を取得するためにselector/xpathで指定する。 Google Chromeではselector/xpath値を簡単に取得できる。 …