Data sources and synchronization solutions - DataWorks - Alibaba Cloud Documentation Center

Synchronization solutions

Solution	Source	Destination	Latency	Use case
Single-table sync (batch)	A single table	A single table or partition	Daily batch or periodic sync	Periodic full or incremental sync
Sharded database and table sync (bacth)	Multiple tables sharing identical schema	A single table or partition	Daily or custom intervals	Periodic full, periodic incremental
Single-table sync (real-time)	A single table	A single table or partition	A few minutes or seconds	Real-time incremental (CDC)
Sharded database and table sync (real-time)	Multiple logical tables (aggregated from physical tables)	One or multiple tables	A few minutes or seconds	Full + real-time incremental (CDC)
Whole-database sync (batch)	An entire database or multiple tables	Multiple tables and their partitions	One-time or periodic	One-time/periodic full, one-time/periodic incremental, one-time full + periodic incremental
Whole-database sync (real-time)	An entire database or multiple tables	Multiple tables and their partitions	A few minutes or seconds	Full + real-time incremental (CDC)
Whole-database full and incremental sync (near real-time)	An entire database or multiple tables	Multiple tables and their partitions	Initial load: Full batch processing Ongoing updates: Daily incremental sync	Full + real-time incremental (CDC)

Data source read/write capabilities

Data source	Single-table sync (batch)	Single-table sync (real-time)	Whole-database sync (batch)	Whole-database sync (real-time)	Whole-database full and incremental (near real-time)
Amazon S3 data source	Read/Write	-	-	-	-
Amazon Redshift data source	Read/Write	-	-	-	-
AnalyticDB for MySQL 2.0 data source	Read/Write	-	-	-	-
AnalyticDB for MySQL 3.0 data source	Read/Write	Write	Read	Write	-
AnalyticDB for PostgreSQL data source	Read/Write	-	Read	-	-
ApsaraDB for OceanBase data source	Read/Write	-	-	Read	Read
Azure Blob Storage data source	Read	-	-	-	-
BigQuery data source	Read	-	-	-	-
ClickHouse data source	Read/Write	-	-	-	-
DataHub data source	Read/Write	Read/Write	-	Write	-
DLF data source	Write	Write	-	Write	-
Db2 data source	Read/Write	-	Read	-	-
Doris data source	Read/Write	Write	-	-	-
DM data source	Read/Write	-	Read	-	-
DRDS (PolarDB-X 1.0) data source	Read/Write	-	Read	-	-
Elasticsearch	Read/Write	Write	Write	Write	-
FTP data source	Read/Write	-	-	-	-
GBase8a	Read/Write	-	-	-	-
HBase	HBase: Read/Write HBase 2.0.x SQL: Read HBase 1.1.x SQL: Write	-	-	-	-
HDFS data source	Read/Write	-	-	-	-
Hive	Read/Write	-	Write	-	-
Hologres data source	Read/Write	Read/Write	Read/Write	Write	-
HttpFile data source	Read	-	-	-	-
Kafka data source	Read/Write	Read/Write	-	Write	-
KingbaseES data source	Read/Write	-	-	-	-
Lindorm data source	Read/Write	-	-	-	-
Simple Log Service data source	Read/Write	Read	-	-	-
MaxCompute data source	Read/Write	Write	Write	-	Write
MariaDB data source	Read/Write	-	-	-	-
Maxgraph data source	Write	-	-	-	-
Memcache data source	Write	-	-	-	-
MetaQ data source	Read	-	-	-	-
Milvus data source	Write	-	-	-	-
MongoDB data source	Read/Write	-	-	Read	-
MySQL data source	Read/Write	Read	Read	Read	Read
OpenSearch data source	Write	-	-	-	-
Oracle data source	Read/Write	Read	Read	Read	Read
OSS data source	Read/Write	Write	Write	-	-
OSS-HDFS data source	Read/Write	Write	-	-	-
PolarDB data source	Read/Write	Read	Read	Read	Read
PolarDB-X 2.0 data source	Read/Write	-	Read	Read	-
PostgreSQL data source	Read/Write	-	Read	Read	-
Redis data source	Write	-	-	-	-
RestAPI (HTTP) data source	Read/Write	-	-	-	-
Salesforce data source	Read/Write	-	-	-	-
SAP HANA data source	Read/Write	-	-	-	-
Sensors Data data source	Write	-	-	-	-
StarRocks data source	Read/Write	Write	Write	-	-
SQL Server data source	Read/Write	-	Read	-	-
Tablestore data source	Read/Write	Write	-	-	-
Tablestore Stream data source	Read/Write	-	-	-	-
TiDB data source	Read/Write	-	-	-	-
TSDB data source	Write	-	-	-	-
Vertica	Read/Write	-	-	-	-
TOS data source	Read	-	-	-	-

Use cases

References

The following Data Integration documents help you get started quickly.

For data source configuration, see Data Source Management.
For synchronization task configuration, see:
- Single-table batch synchronization tasks
- Real-time synchronization on the DataStudio side
- Offline whole-database synchronization tasks
- Data Integration-side synchronization task
- Synchronize full and incremental data in a database to MaxCompute in quasi real time
- Configure a serverless synchronization task
For common data synchronization issues, see FAQ.

DataWorks:Supported data sources and synchronization solutions

Synchronization solutions

Recommended synchronization solutions

1. Batch synchronization solutions (daily batch or periodic sync)

a. Select "Single-table sync (batch)"

b. Select "Whole-database sync (batch)"

2. Real-time synchronization solutions (sub-minute latency)

Select "single-table real-time" or "whole-database real-time"

3. Special case: syncing real-time data to append-only tables

Data source read/write capabilities

Use cases

References