AIデータ変換ツール
JSON・CSV・XML・YAML対応 | 機械学習データ前処理も可能
データフォーマット変換
→
機械学習データ前処理
数値データの正規化・標準化を行います
変換履歴(最近5件)
変換履歴はまだありません
対応フォーマット一覧
| フォーマット | 特徴 | 主な用途 | 拡張子 |
|---|---|---|---|
| JSON | 軽量で読みやすい、階層構造に対応 | Web API、設定ファイル、データ交換 | .json |
| CSV | シンプルな表形式、Excelと互換性 | 表データ、データベースエクスポート | .csv |
| XML | 厳格な構造、拡張性が高い | 企業システム、文書管理、設定 | .xml |
| YAML | 人間が読みやすい、インデントで構造化 | 設定ファイル、Docker、Kubernetes | .yaml, .yml |
データ変換の手順と例
1. JSONからCSVへの変換
変換元(JSON):
[
{"名前": "田中太郎", "年齢": 30, "職業": "エンジニア"},
{"名前": "佐藤花子", "年齢": 25, "職業": "デザイナー"}
]
変換後(CSV):
名前,年齢,職業 田中太郎,30,エンジニア 佐藤花子,25,デザイナー
2. CSVからJSONへの変換
変換元(CSV):
商品名,価格,在庫 ノートPC,89800,15 マウス,2980,50
変換後(JSON):
[
{"商品名": "ノートPC", "価格": "89800", "在庫": "15"},
{"商品名": "マウス", "価格": "2980", "在庫": "50"}
]
3. JSONからYAMLへの変換
変換元(JSON):
{"データベース": {"ホスト": "localhost", "ポート": 5432}}
変換後(YAML):
データベース: ホスト: localhost ポート: 5432
機械学習データ前処理について
正規化(Normalization)
データを0から1の範囲にスケーリングする手法です。Min-Max正規化とも呼ばれ、すべての特徴量を同じスケールに揃えます。
計算式:
正規化値 = (元の値 - 最小値) / (最大値 - 最小値)
例:データ [10, 20, 30, 40, 50] → [0, 0.25, 0.5, 0.75, 1]
標準化(Standardization / Z-score)
データの平均を0、標準偏差を1にする手法です。外れ値の影響を受けにくく、正規分布に近いデータに適しています。
計算式:
標準化値 = (元の値 - 平均値) / 標準偏差
使用場面:SVM、ロジスティック回帰、ニューラルネットワークなど
対数変換(Logarithmic Transformation)
データの分布を正規分布に近づけ、スケールの大きな差を圧縮します。収入データや人口データなど、指数的に増加するデータに有効です。
計算式:
変換値 = log(元の値 + 1)
注意:0や負の値を含むデータには log(x + 1) を使用
主要な変換パターン
構造化データ変換
- JSON ↔ CSV:Web APIデータをExcel分析可能な形式に
- JSON ↔ XML:RESTfulからSOAPへのフォーマット変更
- JSON ↔ YAML:設定ファイルの可読性向上
- CSV ↔ XML:データベースエクスポートと企業システム連携
機械学習データ変換
- 特徴量スケーリング:異なる単位のデータを統一
- カテゴリカルデータのエンコーディング:テキストを数値に変換
- 欠損値処理:不完全なデータの補完
- データ分割:訓練データとテストデータの分離
よくある質問(FAQ)
Q1. どのフォーマットを選ぶべきですか?
用途によって異なります。Web開発ではJSON、データ分析ではCSV、設定ファイルにはYAML、企業システムではXMLが一般的です。JSONは最も汎用性が高く、プログラミング言語との親和性も高いため、迷った場合はJSONをおすすめします。
Q2. 大容量のデータも変換できますか?
本ツールはブラウザ上で動作するため、数MB程度までのデータに適しています。大容量データ(100MB以上)の場合は、専用のデスクトップアプリケーションやサーバーサイドの処理をご利用ください。
Q3. データのセキュリティは大丈夫ですか?
本ツールは完全にブラウザ内で処理を行い、入力されたデータをサーバーに送信することはありません。すべての変換処理はクライアント側のJavaScriptで実行されるため、機密データも安全に扱えます。
Q4. 正規化と標準化の違いは何ですか?
正規化はデータを0-1の範囲に収める手法で、データの分布を維持します。標準化は平均0・標準偏差1にする手法で、外れ値の影響を受けにくい特徴があります。距離ベースのアルゴリズム(k-NN、SVM)には標準化、ニューラルネットワークには正規化が適していることが多いです。
Q5. CSVファイルの文字コードは何ですか?
本ツールはUTF-8文字コードで処理します。Excelで開く場合、日本語が文字化けすることがあります。その場合は、Excelのインポート機能を使用し、文字コードをUTF-8に指定してください。
Q6. 変換エラーが発生する場合は?
入力データの形式が正しいか確認してください。JSONの場合は括弧やカンマの閉じ忘れ、CSVの場合は列数の不一致、XMLの場合はタグの閉じ忘れがよくあるエラー原因です。サンプルデータで動作確認してから本番データを変換することをおすすめします。
参考文献
- Matillion. Data Conversion: What It Is, Types, & Examples. Matillion Learning Center, 2024.
- Powerdrill AI. AIデータ変換ツールおすすめ12選:機能と価格比較. 2026年版データ分析ガイド.
- MatrixFlow. AI・機械学習に必須のデータの前処理:正規化・標準化を使った前処理方法. 機械学習実践ガイド, 2023.
- CodeSignal. Data Preprocessing: Mastering Normalization and Standardization. Machine Learning Course, 2024.
- Zenn. 機械学習モデル作成シリーズ Step1:データの種類とフォーマット解説. 技術記事, 2023.
- Json Work. 無料オンラインJSONツールコレクション:データ変換・フォーマット・検証ツール集.
