Informatica 研修プログラム

1. 初級編(Informaticaの基本的な操作とデータ統合)

1-1. Informaticaの概要とインストール

  • Informaticaとは?: データ統合の基本概念
  • Informaticaのアーキテクチャ: インターフェース、リポジトリ、サーバー
  • Informatica PowerCenterのインストールと設定
  • Informaticaのコンポーネント: PowerCenter、Data Quality、Cloud Data Integrationなど

1-2. 基本的なデータ統合とETLプロセス

  • ETLの基本概念: 抽出(Extract)、変換(Transform)、ロード(Load)
  • ソースとターゲットの設定: データベース、ファイル、XML等
  • データの抽出(Extract): ソースからデータを取得
  • データの変換(Transform): Transformationの使い方(フィルタリング、集計、結合)
  • データのロード(Load): ターゲットへのデータロード

1-3. Informaticaの基本操作

  • PowerCenter Designer: マッピングの作成と管理
  • PowerCenter Workflow Manager: ワークフローの設計とスケジューリング
  • PowerCenter Workflow Monitor: ワークフローの監視とログ確認
  • 基本的なエラーハンドリング

1-4. 基本的なデータマッピングと変換

  • ソースとターゲットのマッピング作成
  • 基本的な変換の使用: Filter、Expression、Joiner、Aggregator
  • データの検証とデバッグ: マッピングのテスト実行

2. 中級編(高度なデータ統合と変換機能の活用)

2-1. 複雑なデータマッピングの作成

  • 複雑なソース・ターゲットのマッピング
  • ターゲットの複数設定とロード方法
  • 複数のソースシステムの統合: 複数ソースからのデータ統合
  • データ型の変換とカスタム変換の作成

2-2. パフォーマンスチューニング

  • インデックスの使用: パフォーマンス向上のためのインデックス設定
  • パーティショニングの活用: 大規模データ処理の効率化
  • メモリ管理とリソース調整
  • 並列処理と分割処理の活用

2-3. ワークフローとセッションの管理

  • ワークフローとセッションの詳細設定
  • エラーハンドリングのカスタマイズ
  • 再実行可能なワークフローの設計

2-4. データ品質管理

  • Informatica Data Qualityの使用: データ品質の監視と管理
  • データクリーニング: 重複データの除去、標準化
  • データ品質のルール設定: 一貫性と正確性のチェック

3. 上級編(高度な統合・運用管理・データ品質)

3-1. 高度なデータ統合技術

  • データのリアルタイム統合: Change Data Capture (CDC)、インクリメンタルロード
  • マルチソース統合とデータウェアハウス
  • パフォーマンスチューニングと最適化: トランザクション管理とログの最適化
  • 大規模データの取り扱い: 非構造化データ、ビッグデータとの統合

3-2. クラウドインテグレーション

  • Informatica Cloud Data Integrationの使用: クラウドアプリケーションとの統合
  • クラウドストレージとデータレイクへの統合
  • クラウドベースでのETLパイプラインの構築
  • APIを使用したデータ統合

3-3. 高度なデータ品質管理

  • データ品質監査: ルールとポリシーの設定、データのトラッキング
  • データクレンジング: 不正確なデータの除去
  • データプロファイリング: データの分析と品質の分析ツールの活用
  • データガバナンスとコンプライアンス: データの整合性維持、GDPRなどの法令遵守

3-4. インフラ管理と運用管理

  • Informaticaサーバーの監視と管理
  • エラー・アラートの設定とトラブルシューティング
  • スケーリングとパフォーマンス管理
  • バージョン管理とアップグレード
  • バックアップとリストア

4. プロフェッショナル編(自動化、ETLの最適化と運用)

4-1. ETLプロセスの自動化

  • Informaticaの自動化ツールの使用
  • スケジュールタスクの設定: 定期的なETL処理の自動化
  • ワークフローとセッションの自動化

4-2. 高度なパフォーマンスチューニングとオプティマイゼーション

  • ETLパフォーマンスのボトルネック分析と改善
  • ストリーミングデータの処理: リアルタイムデータの取り込み
  • 大規模データセットに対する最適化戦略

4-3. マルチソースデータ統合とETLパイプライン

  • 複数システムからのデータ統合の最適化
  • ETLのパイプライン自動化と最適化
  • フレームワークを使った統合の設計

4-4. 高度なエラーハンドリングとデバッグ

  • エラー・アラートのプロアクティブ管理
  • 高度なエラーハンドリング手法
  • 複雑なデータフローのデバッグとログ解析

03-5657-1295

上部へスクロール