科学・IＴ・登山の話題

janomeで品詞を解析する

投稿日：2018年10月26日


import sys
import os
from glob import glob
from janome.tokenizer import Tokenizer

def main():

t = Tokenizer()

print('Target Directory:' + os.path.join(input_dir, '*'))

for path in glob(os.path.join(input_dir, 'ja*')):
  print('Processing {0}...'.format(path), file=sys.stderr)
  with open(path, encoding='utf-8') as file:
    txt = file.read()
    for token in t.tokenize(txt, stream=True):
      print("----" + str(token))
      print(token.part_of_speech)

if __name__=='__main__':
  main()

automated the boring – day 3

dataframe形式で便利なのはいろいろなメソッドが用意されているから

Python + Slack Bot - 1

-Python

執筆者：admin

comment コメントをキャンセル

: pyplotでx軸のラベルを90度回転させる

pyplotでx軸にラベルを記載するとラベル文字数が長すぎるためにお互いにオーバーラップしてみにくい。このよう場合にはpyplot.xticksを実行する際にrotationを指定すればよい。 Ro …

: matplotlibのお役立ちリンク

matplotlibのリファレンスが必要ならこちらを参照する。 https://www.labri.fr/perso/nrougier/teaching/matplotlib/ Related pos …

: numpyのインポートおよび環境確認

機械学習をする際には必須のnumpy。まずはインポートして利用できるようにする。 import numpy as np # 正しくインポートされれば基本的にはメッセージが出てこない。逆に下記のような …

: pycharmでターミナルからconda環境を利用する

pycharmでTerminalを開く conda環境を開く %windir%\System32\cmd.exe “/K” C:\ProgramData\Anaconda3\S …

: dataframe形式で便利なのはいろいろなメソッドが用意されているから

dataframeにすることのメリットは何かといわれると、dataframeにしたとたんに様々な処理をメソッドで実行できるからである。例えば値がNaNになっていると、処理を進めるうえでいろいろな問題 …

PREV: pythonでjanomeを使う
NEXT: RoboBrowserでUser Agentが原因ではねられているとき

2018年10月
月	火	水	木	金	土	日
« 9月		11月 »
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

GIMPでForeground color pickerが正しくない色をピックアップするときの対応方法 2021年9月7日
lerpとslerpの違い 2021年8月5日
シェーダーとは 2021年8月3日
Unityの座標系についてメモ 2021年7月1日
ALLとREMOVEFILTERSの違い 2021年6月28日

janomeで品詞を解析する

Related posts: