Amazon S3やAzure Blob、Google Cloud Storageとの連携を自動化するCData Arc

色川穂高 |

  • この記事をはてなブックマークに追加
  • 本文印刷

 本記事はCDataが提供する「CData Software Blog」に掲載された「CData Arc 機能紹介 - クラウドストレージプロバイダー連携の自動化」を再編集したものです。

 こんにちは。CData Software Japanの色川です。

 B2B連携に必要なあらゆるサービスやデータをノーコード・ローコードでつなげるCData Arcでは「ファイルベースの連携を担うMFT(Managed File Transfer)Connectors」も強力なラインナップで提供しています。

 ArcのMFTコネクタには「FTPや SFTPなど用途の広いファイル転送プロトコル」はもちろん、「AS2やOFTP2などのEDIシーンで標準的に利用されているファイル転送プロトコル」や「OpenPGPなどファイル転送に伴う暗号化・復号化をになうコネクタ」など豊富なラインナップを揃えていますが、ArcのMFTコネクタが持つ豊富なラインナップのなかでも日本のお客さまに数多く利用いただいているのが、Amazon S3やAzure Blob、Google Cloud Storageなど「クラウドストレージプロバイダーとの連携を自動化するMFTコネクタ(クラウドストレージ系コネクタ)」です。

 これらのクラウドストレージ系コネクタは、ドキュメント共有やコラボレーションを含めた連携シナリオで、ハンズオンコンテンツのなかでもご紹介するくらい従来から人気のあるコネクタですが、最近は企業各社におけるAI活用、特にRAGで活用するためのファイルオブジェクトの収集・連携役としても大変多くのニーズをいただいています。

 これまでの記事でもクラウドストレージ系コネクタを利用したシナリオは数多くご紹介してきましたが、この記事では「CData Arcが提供するクラウドストレージ系コネクタのラインナップと共通的に提供される機能」について、あらためてご紹介したいと思います。

クラウドストレージ系コネクタのラインナップ

 CData Arcに搭載されているMFT(Managed File Transfer)Connectorsのなかで、Amazon S3やAzure Blob、Google Cloud Storageなど「クラウドストレージプロバイダーとの連携を自動化」するタイプのコネクタは以下のラインナップで提供されています。

Azure Blob
Box
Dropbox
Google Drive
Google Storage
OneDrive
S3
SharePoint

[ex. Azure Blob コネクタ]

 これらのコネクタは、従来から共有ドキュメントの自動化を含めた連携シナリオなどで数多く活用いただいていましたが、最近ではRAG(拡張検索生成)で活用したい企業データの収集及び、各社のRAG構築サービスで利用するクラウドストレージへの連携役としても非常に多くのニーズをいただいています。

クラウドストレージ系コネクタで共通提供される機能

 それぞれのクラウドストレージプロバイダーでは、接続単位や認証機構、オブジェクト階層の表現や制約など、提供される機能もそれぞれ異なりますが、CData Arcのクラウドストレージ系コネクタでは、それぞれのクラウドストレージプロバイダーで提供される機能群に対して、オブジェクト階層の扱いや再帰を含めたダウンロードやアップロード、処理後のファイルの扱いや効率的なキャッシング機構など、多くの連携シナリオで共通的なニーズといえる部分を高度に抽象化・共通化して提供しています。これにより、どのクラウドストレージプロバイダーに対しても同じ設計・運用パターンでファイルベースのデータ連携を実現することができます。以下では、クラウドストレージ系コネクタで共通的に提供される機能の内、代表的な機能を紹介していきます。

受信(ダウンロード)・送信(アップロード)

 フォルダやコンテナ、パスプレフィックスなど、オブジェクト階層の表現は異なる部分もありますが、Arcのクラウドストレージ系コネクタでは「受信(ダウンロード)先として指定された先からダウンロード」「送信(アップロード)先として指定された先へアップロード」という共通的な概念と操作性で、それぞれのクラウドストレージプロバイダーと連携することができます。

 ファイルマスク指定のサポートや、処理後のファイルの扱いは、クラウドストレージプロバイダー側のAPIサポートなどにより異なる部分もありますが、機能提供されている場合はOn/Off のシンプルな操作性でコントロールできますので、迷うことなくご利用いただけると思います。

受信(ダウンロード)のキャッシング

 前回ダウンロードしてから「それ以降に更新の発生したファイルのみを連携したい」というのは業務の種類を問わずによくあるシナリオです。効率的なファイル連携のためには欠かせないキャッシング機能ですが、Arcのクラウドストレージ系コネクタでは「ファイルサイズ」と「タイムスタンプ」の2つの視点でキャッシングを制御することができます。

サブディレクトリの再帰的な受信(ダウンロード)

 フォルダやコンテナ、パスプレフィックスなど、オブジェクト階層の表現や制約は、それぞれのクラウドストレージプロバイダーで異なりますが、Arcのクラウドストレージ系コネクタでは指定したダウンロード先から、サブディレクトリに相当するオブジェクト階層を再帰的に検索して受信(ダウンロード)することができます。

 Arcのフローのなかで、再帰的に取得されたファイルオブジェクトには取得元のオブジェクト階層情報などがメタデータとして付与されます。これにより、異なるクラウドストレージプロバイダーに対して、取得元と同じオブジェクト階層を構成する形で連携することができるようになっています。この機能は、Arcのクラウドストレージ系コネクタが共通的に持つ機能のなかでも、非常に利便性の高い機能のひとつです

その他

 ここまでクラウドストレージ系コネクタで共通的に提供される代表的な機能をご紹介しましたが、それぞれのコネクタでは対応するクラウドストレージプロバイダーに特化した機能もサポートしています。例えば、Dropboxコネクタでは「名前空間Id(チームフォルダ)」の利用がサポートされており、Google Driveコネクタでは「ドキュメントのエクスポート形式」を指定することもできます。SharePointライブラリ用のSharePointコネクタでは共有化された接続がサポートされており、多くのフローで同じドキュメントライブラリを扱いたいときに便利です。

まとめ

 この記事では「CData Arcが提供するクラウドストレージ系コネクタのラインナップと共通的に提供される機能」について、ご紹介しました。

 Arcのクラウドストレージ系コネクタは、従来から数多く活用いただいている「BoxやSharePointライブラリへのドキュメント連携の自動化」はもちろん、最近では「AWSやAzure、GCPなど各社のRAG構築サービスで利用するクラウドストレージへの連携役」としても非常に多くのニーズをいただいています。クラウドストレージプロバイダーとの連携シナリオで共通的なニーズを高度に抽象化・共通化して提供されるArcのクラウドストレージ系コネクタは、シンプルな操作性で、どのクラウドストレージプロバイダーに対しても同じ設計・運用パターンでファイルベースのデータ連携を実現することができます。もちろん、ファイル同士の連携シナリオに限らず、ファイルへの変換や、ファイルからの変換もArcの得意分野です。

 CData Arcはシンプルで拡張性の高いコアフレームワークに、豊富なMFT・EDI・エンタープライズコネクタを備えたパワフルな製品です。CData Driversとの組み合わせで270を超えるアプリケーションへの連携を実現できます。

 皆さんのつなぎたいシナリオでぜひ CData Arcを試してみてください。
CData Arc - セキュアなデータ連携とマネージドファイル転送(MFT)

 製品を試していただくなかで何かご不明な点があれば、テクニカルサポートへお気軽にお問い合わせください。
CData Software Japan - Support Form

※この記事では CData Arc™ 2025 - 25.2.9376.0 を利用しています

過去記事アーカイブ

2025年
01月
02月
03月
04月
05月
06月
07月
08月
09月
10月
11月
2024年
02月
03月
04月
05月
06月
07月
08月
09月
10月
11月
12月
2023年
04月
07月
08月
09月
10月
11月
12月