【ぱんだす】
pandas(パンダス) とは?
💡 Pythonでのデータ分析を支える「表計算の達人」
📌 このページのポイント
pandasって何ができるの?
Excelじゃダメなの?
データサイエンスでは必須なの?
pandasの苦手なことってある?
メモリに乗り切らない大規模データの処理が苦手なんだ。pandasは全データをメモリに読み込むから、数十GB以上のデータだとメモリ不足で落ちてしまう。そういう場合はDaskやPolarsのような代替ライブラリを使うんだけど、ここで面白い議論がある。Polarsというライブラリがpandasの数倍〜数十倍速いことがベンチマークで示されていて「pandasはもう古い」という意見が出始めている。でもpandasのエコシステム(他のライブラリとの連携、情報の多さ、チームの知見)は圧倒的で、簡単には置き換えられない。技術的な優位性だけでは既存ツールを駆逐できないというのは、ソフトウェアの世界でよくある話だよ。
📖 おまけ:英語の意味
「pandas(Panel Data Analysis)」 = パネルデータ分析
💬 経済学で使われる「パネルデータ(時系列×横断面データ)」の分析が名前の由来。動物のパンダとは関係ないよ