R言語でデータフレームの特定行を除外する方法
発端
{RMeCab}
パッケージによる形態素解析をした結果、無駄な行名が一部あった。
元の文章をgsub
関数なりで先に綺麗にすれば良いが、「そういえば行名指定で取り除く方法って何だっけ」と思い調べたのでメモ。
方法
重複確認に便利な%in%
演算子を用いて、指定行名と重ならない行だけを抽出する
test_df[!(rownames(test_df) %in% c("行名1","行名2")), ]
最後に
行名指定でなければ、dplyr::filter
やbase::subset
により指定条件の行抽出をすることができる。また列名だとdplyr::select
やdplyr::select_each
関数などで簡単にできる。この行名バージョンを発見したら追記する。