科学の箱

科学・IT・登山の話題

Python

RoboBrowserで提供しているメソッドget_linksにおけるパラメータの指定方法

投稿日:2018年10月31日 更新日:

get_linksは便利だが文字列を指定する際に少々手間取った。

結論から言うと文字列で指定する方法とre.compileオブジェクトを指定する方法の2つがある。

まず一つ目は単純な文字列。exact matchでなくてもよいがwild card等は使えない。


links = Browser.get_links('次') # This is OK

それに対して正規表現が使えるのが下記指定方法


links = browser.get_links(re.compile('.*次'))

メタ情報

inarticle



メタ情報

inarticle



-Python

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

seabornをEDAに応用する

seabornを利用すれば基本となるビジュアルと分布、regressionをすぐに取得できる。 import seaborn as sns tips = sns.load_dataset(‘tips’ …

no image

Pythonまとめ

環境設定 環境設定 基本 Hello Worldを実行 数字、計算、文字列を画面出力   文字列 Pythonで文字列を生成するときの方法についてまとめる 制御フロー if ループ イテレー …

no image

グラフの軸を操作する

概要 ここでは以下の項目について取り扱う 軸にラベルを設定する ー xlabel, ylabel 軸の最小値、最大値を設定する ー xlim, ylim, xaxis 軸にメモリを設定する ー xti …

no image

selectorとxpathを手軽に取得する方法

スクレイピングをするプログラムを開発するときに対象となる項目を取得するためにselector/xpathで指定する。 Google Chromeではselector/xpath値を簡単に取得できる。 …

no image

janomeで品詞を解析する

  import sys import os from glob import glob from janome.tokenizer import Tokenizer def main(): …

2018年10月
« 9月   11月 »
1234567
891011121314
15161718192021
22232425262728
293031  

side bar top



アーカイブ

カテゴリー