微忘録

好奇心に記憶力がついていかない人のブログ

R言語でデータフレームの特定行を除外する方法

発端

{RMeCab}パッケージによる形態素解析をした結果、無駄な行名が一部あった。 元の文章をgsub関数なりで先に綺麗にすれば良いが、「そういえば行名指定で取り除く方法って何だっけ」と思い調べたのでメモ。

方法

重複確認に便利な%in%演算子を用いて、指定行名と重ならない行だけを抽出する

test_df[!(rownames(test_df) %in% c("行名1","行名2")), ]

最後に

行名指定でなければ、dplyr::filterbase::subsetにより指定条件の行抽出をすることができる。また列名だとdplyr::selectdplyr::select_each関数などで簡単にできる。この行名バージョンを発見したら追記する。