データの集計

やや大きめのデータの集計って一般的にはどうやっているのだろう。
この場合の大きめというのは10万件ぐらいのサンプルを想定しているのだけど、このサイズだとExcelでは素直に扱えないよな。そもそもExcelってデータとコードの分離が出来ないので、任意のデータの集計には向かないと思うんだ。一度集計用の仕組みを書いたとして、追加のデータを集計したいときにはそれを一々コピペするのだろうか。
普段cliで生活している人間としては普通にperlなどのスクリプト言語で処理を書けばいいのだけど、どこでもperlを入れて作業していいものでもないし、Unixコマンドラインの調達が難しい環境もある。安易に社外のホストに入って作業するのも、データの持ち出しになるので不味そうだ。
大学の研究室に居たときも実験データの集計をやっていたが、あのときは専用の統計アプリがあったのでそれを使っていた気がする。
しがないリーマンとしては何を使って集計すればいいんだぜ?