S3 Filesで消えるアーキテクチャ層、生まれるアーキテクチャ
ARANK
2026年4月7日、AWSがAmazon S3 Filesを一般提供(GA)しました。S3バケットをNFS v4.1/v4.2のファイルシステムとしてマウントできる機能です。EC2、EKS、ECS、Lambdaのいずれからでも利用できます。 Filesが解こうとしている問題まず出発点の認識を合わせておきます。たとえば、MLチームが学習データの前処理をするとしましょう。元データはS3に置いてあります。pandasで読み込んで加工したい。しかし pd.read_csv("s3://my-bucket/data.csv") とは書けますが、内部ではboto3がGETリクエストを発行してメモリに読み込んでいます。処理結果を書き戻すにもPUTが必要です。手元のスクリプトで open("./data.csv") と書くのとは根本的に異なるI/Oモデルで動いています。もう少し規模が大きくなると、この問題は「パイプラインのアーキテクチャ課題」に格上げされます。以下のような構成を多くの組織が運用しているはずです。S3からEFS/EBSにコピーして、処理して、結果をS3に書き戻す。この「中間のコピー層」は本来やりたい処理そのものではなく、ストレージのI/Oモデルの違いを埋めるためだけに存在しています。データ同期のスクリプト維持、コピー中の一貫性管理、EFSのプロ…