Global-Scale Apps Using Globally Distributed Autonomous Databases | Oracle DatabaseWorld AI Edition

Oracle
30 May 202419:22

Summary

TLDROracleのグローバル分散型自律データベースについて紹介するビデオスクリプトです。シールディングされたデータベースは、データのスケーラビリティ、生存性、データ主権のために世界中にデータを透過的に分散します。2017年にネイティブデータベースシールディングがリリースされ、現在では世界中の重要な分散アプリケーションを支えています。データ主権の透明性や超スケーラビリティを備えた単一の論理データベースとして動作し、データセンターやリージョン間でデータが再分散されることでアクティブアクティブアーキテクチャが可能になります。また、データ規制が増加する中でOracleのデータベースはその波を乗りこなすのに役立ち、分散データベースの複雑さを解消し、コストを削減します。

Takeaways

  • 🌐 Oracleのグローバル分散型自律データベースは、データのスケール、生存性、データ主権のために世界中にデータを透過的に分散します。
  • 📚 分散データベースとは、複数の物理的な場所にデータを格納するデータベースで、各場所がデータのサブセットを保管します。
  • 🔧 Oracleデータベースは2017年にネイティブなデータベースシャーディングがリリースされた際に分散データベースとなり、現在では世界中の重要な分散アプリケーションを駆動しています。
  • 💾 分散データベースの2つの主なユースケースは、ultimate scalability and survivability、透明なデータ主権です。
  • 🗺️ Oracleグローバル分散データベースは単一の論理データベースであり、データはシャードと呼ばれる複数の物理的なデータベースに物理的に分散されています。
  • 🔄 Oracleのデータベースはデータの再分散やシャード間のデータの自動再バランスをオンラインで実行し、ダウンタイムを発生させずにスケールアウトやスケールインに対応します。
  • 🇮🇳 データ主権は多くの国で義務付けられており、たとえばインドの支払いデータの場合、_reserve Bank of Indiaのデータローカリゼーション規則により、支払いデータはインドに保管する必要があります。
  • 🏦 アメリカ最大手の銀行は、規則に従うために支払いデータベースを再アーキテクチャ化し、Oracleのグローバル分散データベースを使用してインドの規則に簡単に対応しました。
  • 🚀 BlueKaiはデジタルマーケティングキャンペーンのためのリーディングデータプラットフォームで、Oracleのグローバル分散データベース上で動作し、複数のデータセンターにわたって2.5ペタバイトのデータを分散しています。
  • 🛡️ Oracleのグローバル分散データベースは、他の分散データベースよりも建築的に優れており、SQLをサポートする分散スケールアウトアーキテクチャを提供しています。
  • 🤖 Oracle Globally Distributed Autonomous Databaseは自律管理を追加し、分散データベースの運用の複雑さを排除し、コストを削減します。

Q & A

  • Oracleのグローバル分散型自律データベースとは何ですか?

    -Oracleのグローバル分散型自律データベースは、データが世界中の複数の場所に透過的に分散されることで、スケール、生存力、データの主権性を提供するデータベースです。

  • 分散データベースの主なユースケースはどのようなものですか?

    -分散データベースの主なユースケースは、究極のスケーラビリティと生存力、そして透過的なデータ主権性です。前者ではデータが分散・複製され、ハイスケールとフォールトトレランスを実現します。後者では各国のデータが国内に保管され、規制要件を実施するのに役立ちます。

  • Oracleデータベースはいつから分散データベースとなりましたか?

    -Oracleデータベースは2017年にネイティブデータベースシャーディングがリリースされた時から分散データベースとなりました。

  • Oracleのグローバル分散型データベースが提供する主な機能は何ですか?

    -Oracleのグローバル分散型データベースは、単一の論理データベースとして機能し、データが複数のシャードに物理的に分散されています。各シャードはデータの生存力を確保するための複製を持ち、アプリケーションリクエストを処理できます。アクティブアクティブアーキテクチャを可能にし、データの再配布がリアルタイムで行えます。

  • データ主権性規制がどのようにOracleのグローバル分散型データベースに影響を与えると述べていますか?

    -データ主権性規制は、特定の国のデータがその国内に保管される必要があると定める規制です。これにより、一つのデータベースに世界各国のデータを保管するグローバルファイナンシャルサービス企業は、規則に従うためにデータベースを再アーキテクチャする必要が生じます。

  • BlueKaiという企業がどのような課題を抱えており、Oracleのデータベースはどのようにその課題に対処していますか?

    -BlueKaiはデジタルマーケティングキャンペーンのためのリーディングデータプラットフォームで、リアルタイムアクセスが必要なハイスケールワークロードを持っています。Oracleのグローバル分散型データベースにより、以前のNoSQL製品から簡素化された新しいアーキテクチャに移行し、SQLの力でより迅速にイノベーションが行えるようになりました。

  • Oracleのデータベースはどのようにして分散データベースのパフォーマンスとスケーラビリティを確保していますか?

    -Oracleは独自の分散スケールアウトアーキテクチャを持ち、NoSQLエンジンの上に他の分散データベースが動作するのとは異なり、SQLワークロードに適したパフォーマンスを提供しています。また、データの配布、複製、シャード配置の方法が他にないほど多様で柔軟性があります。

  • Oracleのグローバル分散型データベースにおけるデータの配布方法は何ですか?

    -Oracleは複数のデータ配布方法をサポートしており、これには値ベースのデータ配布、システム管理データ配布、複合データ配布、ユーザー定義データ配布、重複データ配布、パーティションデータ配布が含まれます。これにより、データは最適な方法でシャード間で配布され、効率的に管理されます。

  • Oracleのデータベースにおけるデータの複製方法にはどのようなものがありますか?

    -Oracleのデータベースは、リアルワールドネットワークの不安定性に対応するように設計された複数の複製方法を提供しています。これには同期複製、非同期複製、アダプティブ同期複製、ローカル同期とリモート非同期複製の組み合わせが含まれます。

  • Oracleのグローバル分散型自律データベースのデモではどのような操作が行われていますか?

    -デモでは、Oracle Cloud Infrastructureコンソールからグローバル分散型自律データベースの作成フローを説明しており、データの配布方法、シャードの配置場所、シャードの形状とサイズ、レプリケーションの設定などを行うことができます。

  • Oracle Database 23aiではどのような新機能が追加される予定ですか?

    -Oracle Database 23aiでは、Raftベースの複製による極度の生存力強化、AI ベクター検索と検索結果の強化などが予定されており、これにより分散データベースの機能がさらに向上する見込みです。

Outlines

00:00

🌐 Oracleの分散型データベースの紹介

Shailesh DwivediがOracleのグローバル分散型自律データベースについて説明。2017年にデータベースシャーディングがリリースされ、分散データベースとして機能するようになった。データは複数の物理的な場所に格納され、アプリケーションからはその分布は隠されており、自動的に適切な場所にルーティングされる。分散データベースはスケーラビリティと生存力、またはデータ主権のためにデータを複数のデータベースに分散し、複製する。また、国ごとのデータが国内に保管されることで規制要件を満たす。Oracleのグローバル分散データベースは単一の論理データベースとして機能し、データはシャードと呼ばれる複数のデータベースに物理的に分散される。データはシャード内で複製され、アクティブなシャードがアプリケーションリクエストを処理することができる。データは動的にシャード間で再分配でき、アプリケーションからはその再分配が隠されている。

05:03

🚀 BlueKaiのハイスケール分散データベースの活用

BlueKaiはデジタルマーケティングキャンペーンのためのリーディングデータプラットフォームで、リアルタイムアクセスが必要なハイスケールワークロードを担当。Oracleのグローバル分散データベースを利用して、104のコモディティサーバーで動作し、5,408のCPUコアと77.4TBのメモリを持つ。NoSQL製品から移行し、SQLのパワーと新しいアーキテクチャのシンプルさを活用して、より迅速にイノベーションを遂げる。データ総量は2.5PBで、複数のデータセンターに分散されており、各データセンター内のシャードには別のデータセンターにあるレプリカが存在し、データセンターの停止にも耐える。Oracleは他の分散データベースと比較して、アーキテクチャが優れており、SQLをフルサポートするスケールアウトクラスタを提供。

10:04

🛡️ Oracleの分散データベースの耐障害性と展開アーキテクチャ

Oracleの分散データベースは、アプリケーションのニーズに応じてレプリケーションを設定することができ、スケーラビリティや生存力ニーズを満たす。アクティブデータガードを通じてリドレベルのレプリケーションをサポートし、GoldenGateを通じてSQLレベルのレプリケーションも可能。シャード展開アーキテクチャも他と比べて多岐にわたり、独立サーバー、耐障害クラスター、Exadataスケールアウトクラスター、オンプレミス、クラウド、多云などに対応。Oracleのグローバル分散データベースは現代のアプリケーションに適しており、多様なデータ技術を単一のデータベースでサポート。

15:08

🔐 Oracle Globally Distributed Autonomous Databaseのデモンストレーションと新機能

Oracle Cloud Infrastructureコンソールからグローバル分散自律データベースの作成プロセスをデモンストレーション。データの配布方法、シャード数、場所、形態、サイズ、レプリケーションを設定し、数クリックでデータベースを作成可能。既にプロビジョニングされたデータベースを確認し、単一の論理エンドポイント経由でアプリケーションが接続することができる。自然言語クエリもサポートし、AIを活用して自然言語の質問をSQLに変換。今後のアップデートとして、Raftベースのレプリケーション、AI ベクター検索など、新機能が追加される予定。

Mindmap

Keywords

💡分散データベース

分散データベースとは、データが1つの場所ではなく、複数の物理的な場所に保存されるデータベースのことです。これは、スケール、生存性、データの主権性のためにデータを世界中に透過的に分散させるOracleのグローバル分散データベースの核心です。ビデオでは、分散データベースが2017年にネイティブデータベースシャーディングがリリースされた時からオラクルデータベースに存在し、多くの重要な分散アプリケーションを支えていると説明されています。

💡シャーディング

シャーディングは、データベースを複数のサブセットに分割し、それぞれのサブセットを別々の物理的な場所に保管するデータベース設計の手法です。ビデオでは、Oracleデータベースがシャーディングを通じて分散データベースとなり、データのスケーラビリティと生存性を提供する上で重要な役割を果たしていると述べています。

💡データ主権

データ主権は、各国の規制要件を支援するために、各国のデータをそれぞれの国内に保管する必要性を指します。ビデオでは、インドのデータローカリゼーション規則がこれに該当し、金融サービス企業にとって重要な課題となっていると紹介されています。

💡アクティブアクティブアーキテクチャ

アクティブアクティブアーキテクチャとは、すべてのデータベースがアプリケーションリクエストを処理できる構成です。ビデオでは、Oracleグローバル分散データベースがアクティブアクティブアーキテクチャを可能にし、データが複数のシャード間で再分配されることでスケーラビリティと柔軟性を高めると説明されています。

💡ハイパースケール

ハイパースケールは、データが複数のデータベースに分散され、レプリケーションされることでスケールアウトアーキテクチャを実現する概念です。ビデオでは、ハイパースケールが分散データベースの主要なユースケースの一つとして挙げられ、大規模なスケーラビリティと容错性を実現する上で重要な役割を果たしていると述べています。

💡マルチテナント

マルチテナントとは、単一の物理的なデータベース上で複数のデータベースを実行するアーキテクチャです。ビデオでは、Oracleのグローバル分散データベースがマルチテナントアーキテクチャを通じて、単一の論理データベースとして機能し、データが複数のシャードに物理的に分散されると説明されています。

💡クエリコーディネーター

クエリコーディネーターは、複数のシャードからデータを必要とするリクエストを自動的にルーティングするコンポーネントです。ビデオでは、クエリコーディネーターが分散データベースにおいて重要な役割を果たし、複数のシャードにまたがるリクエストを効率的に処理することができると紹介されています。

💡データローカライズーション

データローカライズーションは、特定の国のデータをその国内に保管する必要性を指します。ビデオでは、Reserve Bank of Indiaのデータローカリゼーション規則がこれに該当し、グローバル金融サービス企業が単一データベースに各国のデータを保管するのではなく、データローカライズを遵守する必要があると述べています。

💡ハイパースケールワークロード

ハイパースケールワークロードとは、非常に大きなデータセットを扱い、非常に高いスループットと低レイテンシを必要とするデータベースの負荷です。ビデオでは、BlueKaiという企業がデジタルマーケティングキャンペーンのためのハイパースケールワークロードを持ち、リアルタイムアクセスを必要としていると紹介されています。

💡オートノームデータベース

オートノームデータベースは、オペレーションの複雑さを自動化し、コストを削減することができるデータベースです。ビデオでは、Oracleがオートノーム管理を通じてグローバル分散データベースの運用を簡素化し、分散データベースの運用の複雑さを排除することができると紹介されています。

Highlights

Oracle's Globally Distributed Autonomous Database transparently distributes data across the globe for scale, survivability, and data sovereignty.

A distributed database stores data across multiple physical locations instead of one, with the physical distribution hidden from applications.

Oracle database introduced native database sharding in 2017, enabling it to become a distributed database.

Distributed databases serve two main use cases: ultimate scalability and survivability, and transparent data sovereignty for regulatory compliance.

Oracle's Globally Distributed Database is a single logical database with data physically distributed across multiple databases called shards.

Data in each shard is replicated for survivability, and all shards can process application requests, enabling an active-active architecture.

Data can be redistributed across shards, data centers, and regions while the database is up and running, with distribution hidden from applications.

Oracle's Globally Distributed Database allows for massively parallel analytics by parallelizing queries within and across shards.

Data sovereignty is becoming mandatory in many countries, impacting global financial services companies.

Oracle enabled a US bank to comply with India's data localization regulations by creating new shards in India with minimal application changes.

BlueKai, a leading data platform for digital marketing, runs on Oracle's Globally Distributed Database, processing 1 million transactions per second.

Oracle's architecture is ahead of others, with Oracle RAC designed from the start to deliver full SQL in a scale-out cluster.

Oracle supports more data distribution methods than any other distributed database, including value-based, system managed, composite, user-defined, duplicate, and partitioned distribution.

Oracle has more replication methods designed for real-world networks, including synchronous, asynchronous, adaptive synchronous, and a combination of local synchronous with remote asynchronous replication.

Oracle offers more shard deployment architectures, including independent servers, fault-tolerant scalable clusters, and across on-premises, in-cloud, and multiple clouds.

Oracle's Converged Database Architecture simplifies distributed databases by supporting all modern data types, workloads, and development styles in one database.

Oracle Globally Distributed Autonomous Database adds autonomous management to eliminate operational complexity and reduce cost.

Oracle brings natural language query to the Globally Distributed Database using autonomous database Select AI, translating natural language questions into SQL.

Upcoming features in Oracle Database 23ai include Raft-based replication for extreme survivability and AI Vector Search and Retrieval Augmented Generations.

Oracle's Globally Distributed Database is the most fully featured, providing more distribution, replication, and deployment methods, with autonomous capabilities that remove complexity and reduce cost.

Transcripts

play00:05

Hello everyone. My name is Shailesh Dwivedi.

play00:08

I'm responsible for product management

play00:10

and cloud engineering

play00:11

for Oracle's Globally Distributed Autonomous Database.

play00:16

Oracle's Globally Distributed Autonomous Database

play00:19

transparently distributes data across globe for scale,

play00:24

survivability, and data sovereignty.

play00:27

What is a distributed database?

play00:29

It's a database that stores data across

play00:33

multiple physical locations instead of one location.

play00:36

Each location stores a subset of data.

play00:39

The physical distribution

play00:41

of data is hidden from the applications

play00:43

and it transparently gets routed to the right location.

play00:47

The Oracle database became a distributed database in 2017

play00:51

when native database sharding was released.

play00:54

Today, it powers many critical

play00:57

distributed applications around the world.

play00:59

There are two main use cases for distributed databases,

play01:03

ultimate scalability and survivability,

play01:06

where data is distributed

play01:07

and replicated across databases for hyperscale

play01:11

and fault tolerance.

play01:12

The second use case is transparent data sovereignty,

play01:16

where each country's data is stored in country

play01:19

to help implement regulatory requirements.

play01:23

An Oracle Globally Distributed Database

play01:25

is a single logical database.

play01:27

Data is physically distributed across multiple databases,

play01:31

which are called shards.

play01:32

Data in each shard is replicated for survivability.

play01:36

All shards can process application requests.

play01:39

This enables an active-active architecture.

play01:43

Data can be redistributed across shards, data centers,

play01:47

and regions while the database is up and running.

play01:51

The distribution of data is hidden from the applications.

play01:55

Application requests

play01:56

that only need data from a single shard

play01:59

are transparently sent directly to that shard.

play02:02

Requests that need data from multiple shards

play02:05

are automatically split

play02:06

into multiple requests that are sent

play02:09

to the appropriate shards

play02:10

and committed atomically.

play02:12

Queries can be parallelized both within and across shards

play02:17

to implement massively parallel analytics.

play02:22

This is the next generation

play02:23

of big data done right.

play02:26

Distributed databases distribute data

play02:28

across multiple physical databases.

play02:30

This allows data to be placed

play02:32

in multiple geographic locations.

play02:34

It's a wide single database

play02:36

scalability and survivability limits

play02:38

since databases are independent of each other.

play02:42

Requests that need data from multiple shards

play02:44

are automatically routed through a query coordinator.

play02:47

Let's take a look at two customer examples.

play02:51

Data sovereignty is becoming mandatory in many countries

play02:55

like India for payment data.

play02:57

The Reserve Bank of India data localization regulations

play03:00

state that payment data must reside in India

play03:04

if both the payer and the payee are Indian entities.

play03:08

This is a show-stopper

play03:09

for global financial services companies

play03:12

that store data from all countries in a single database.

play03:16

The key observations here are

play03:18

that the data must be physically stored in India,

play03:21

but it can be accessed from anywhere.

play03:23

One of the largest US banks

play03:25

had to rearchitect their payment database

play03:28

to satisfy this regulation.

play03:30

Initially, all worldwide payment data was stored

play03:33

in the US on Exadata systems.

play03:37

The application and the database tier were replicated

play03:41

across regions inside the US for disaster recovery.

play03:45

Oracle's Globally Distributed Database

play03:47

enabled the bank to easily comply with India's regulations.

play03:50

New shards were created in India to hold India data.

play03:54

The new database architecture required

play03:56

minimal application changes.

play03:58

The highly complex application tier architecture

play04:02

did not need to be redundantly deployed in India.

play04:05

One thing is guaranteed,

play04:06

data regulation will only increase.

play04:08

In fact, a tidal wave of data regulations is coming

play04:11

as more countries roll out their own regulation

play04:15

and more industries become regulated.

play04:17

Oracle's Globally Distributed Database implements features

play04:21

that can help you surf this tidal wave

play04:24

instead of being drowned by it.

play04:26

Let's take a look at another customer example.

play04:29

BlueKai is a leading data platform

play04:31

for digital marketing campaigns.

play04:33

The data is accessed in real time by hundreds of millions

play04:37

of consumers as they surf the internet.

play04:39

BlueKai is a hyperscale workload on a multi-petabyte

play04:43

database that requires near instant response time.

play04:47

It processes 1 million transactions per second,

play04:50

and it invokes 30 billion APIs per day

play04:53

with a response time of 1.6. milliseconds.

play04:56

BlueKai now runs on Oracle's Globally Distributed Database.

play05:00

It runs on 104 commodity servers,

play05:03

which cumulatively have 5,408 CPU cores

play05:07

and 77.4 terabytes of memory.

play05:11

It was migrated from a combination

play05:13

of NoSQL products like Aerospike, Cassandra, ScyllaDB.

play05:18

The simplicity of new architecture

play05:20

plus the power of SQL enables BlueKai

play05:23

to innovate many times faster than before.

play05:26

The total data volume is 2.5 petabytes

play05:29

and is distributed across multiple data centers.

play05:33

Each of the shards in a data center has a replica

play05:37

in a different data center,

play05:38

hence enabling BlueKai

play05:40

to survive an outage of an entire data center.

play05:43

Oracle's Globally Distributed Database

play05:45

is architecturally ahead of others.

play05:48

Oracle RAC was architected from day one

play05:51

to deliver full SQL in a scale-out cluster.

play05:54

Oracle has extended this mature parallel cluster SQL engine

play05:58

to support distributed scale-out architecture.

play06:01

Other distributed databases run on top of NoSQL engines.

play06:05

Some are slowly adding SQL on top,

play06:08

which would require decades of work.

play06:11

NoSQL engines allowed them to get to market quickly,

play06:14

but now they suffer from poor performance

play06:16

since NoSQL engines are not designed for SQL workloads,

play06:19

this is especially bad for reporting

play06:22

and analytics kind of queries.

play06:24

Oracle has more data distribution methods

play06:26

than any other distributed database.

play06:28

The data across multiple tables

play06:31

is partitioned and is for a given sharding key

play06:34

is co-located on one of the shard,.

play06:36

For example, we have three tables, customer, order

play06:39

and line items, and the data for Mary

play06:42

across all three tables whose customer ID is 123

play06:45

is co-located on shard number two.

play06:48

Likewise, John's data, which is in green, across all tables,

play06:51

is co-located on shard number three.

play06:54

And Peter's data, which is in blue,

play06:55

is co-located on shard number one.

play06:57

This allows us to execute joins in a very optimal manner.

play07:02

All the joins are satisfied locally on a given shard.

play07:06

Additionally, all the constraints

play07:08

are also satisfied on a given shard.

play07:10

If we have certain tables which are more like

play07:13

dimension table or reference tables in this case,

play07:16

like a product catalog, the data for those tables

play07:21

is automatically replicated across all shards.

play07:25

Such tables are called duplicate tables.

play07:28

Oracle supports value-based data distribution.

play07:31

This distributes data by a value, for example,

play07:34

a country code or a product ID

play07:36

or distributes data by a range of values.

play07:39

For example, ranges of phone numbers.

play07:41

Oracle supports system managed data distribution.

play07:44

It uses a consistent hash algorithm

play07:47

to evenly distribute data across shards

play07:49

or scalability and parallelism.

play07:52

For example, to distribute data by customer ID,

play07:55

device ID, or action ID.

play07:57

Consistent hash enables online addition of shards

play08:01

with minimal data movement.

play08:03

Oracle also supports composite data distribution.

play08:06

This is two levels of sharding

play08:08

with two different sharding keys

play08:10

and two different sharding methods.

play08:12

Data is first distributed by value.

play08:14

For example, a country code or a range,

play08:17

for example, a phone number.

play08:18

Then data is distributed evenly across data centers,

play08:23

for example, using a customer ID

play08:25

as a second sharding key,

play08:28

using consistent hashing as a second sharding method.

play08:32

Oracle also supports user-defined data distribution.

play08:35

This is useful when data requires special handling,

play08:38

such as skewed data.

play08:40

For example, we can store Taylor Swift's

play08:43

and Beatles data in their own shard

play08:45

and combine smaller artist data together

play08:48

in a separate shard.

play08:49

Oracle supports duplicate data distribution.

play08:52

This is useful for small tables that are read-only,

play08:55

can be duplicated across all shards.

play08:58

This is used to avoid cross-shard queries

play09:00

and cross-shard referential integrated checks.

play09:03

Oracle supports partitioned data distribution

play09:06

within each shard.

play09:07

For example, the data in any shard can further

play09:10

be partitioned by data values such as date range,

play09:14

and then further partitioned by another data value or hash.

play09:18

This enables faster queries and joins within a shard.

play09:22

Shards can also be added without incurring any downtime,

play09:26

and the data automatically gets redistributed across shards.

play09:30

This is to enable scale-out or scale-in for seasonality.

play09:35

Data across shards is automatically rebalanced

play09:37

with minimum data movement.

play09:39

This is an online operation. It does not incur any downtime.

play09:43

Oracle has more replication methods

play09:45

than any other distributed database.

play09:47

Oracle replication is designed for real-world networks.

play09:51

Real-world distributed networks are flaky.

play09:54

They incur long latencies, intermittent slowdowns,

play09:57

and unpredictable stalls

play09:59

that can wreck havoc on the application

play10:01

response time and availability.

play10:04

Oracle distributed database replication

play10:05

can be configured to satisfy the needs of each application.

play10:08

For example, can be configured

play10:10

in a synchronous replication manner,

play10:13

asynchronous replication manner,

play10:15

adaptive synchronous replication,

play10:17

or a combination of local synchronous

play10:20

and remote asynchronous replication.

play10:22

Oracle replication can meet any scaling

play10:24

or survivability needs.

play10:26

It supports a redo level replication using

play10:28

Active Data Guard that provides fastest performance,

play10:31

most comprehensive SQL functionality, readable replicas,

play10:35

and provides simplest operation.

play10:37

It also supports SQL level replication

play10:40

using GoldenGate that provides fastest failover,

play10:44

fully writeable replicas,

play10:46

including conflict avoidance and resolution.

play10:49

Oracle has more shard deployment architectures

play10:52

than any other distributed database.

play10:54

Oracle can be deployed on independent servers.

play10:57

This is a simple low cost deployment option

play11:00

that is very popular.

play11:01

Shards can run on standalone commodity servers.

play11:05

Oracle can deploy shards on fault-tolerant

play11:08

scalable clusters as well.

play11:09

Oracle can uniquely scale performance within a shard

play11:13

or a region using an ultrafast Exadata scale-out cluster.

play11:17

This enables data to be accessed within a region

play11:20

without slow cross-shard access and coordination.

play11:24

Failure or maintenance of servers

play11:26

or databases in a cluster does not require

play11:29

disruptive application failover to a replica.

play11:32

Oracle can deploy shards across on premises, in cloud,

play11:36

and multiple clouds.

play11:37

You can choose the deployment option independently

play11:40

for each shard or country.

play11:42

This can be optimized for scaling needs

play11:44

and cloud availability of each region.

play11:46

Oracle can deploy shards within a fault-tolerant cluster.

play11:50

This is useful for customers who want

play11:52

the highest transparency and simplicity

play11:54

and don't need the distributed data or sovereignty

play11:58

or ultimate scale-out.

play12:00

Sharding is used to route SQL with specific node

play12:03

of a cluster for increased access locality

play12:06

and hard spot avoidance.

play12:08

Cross-shard SQL within a cluster is super fast

play12:11

unlike the distributed shards.

play12:13

Oracle's Globally Distributed Database

play12:15

is designed for modern applications.

play12:18

Modern applications use multiple data technologies.

play12:22

For example, they use new types

play12:24

of data like relational, JSON, spatial, graph,

play12:29

new types of analytics like SQL, machine learning,

play12:32

new workload types like AI vectors,

play12:36

internet of things, blockchain.

play12:38

One approach to deploying rich modern apps is

play12:41

to use a specialized database for each application need.

play12:46

The specialized database approach

play12:47

makes data sovereignty nearly impossible.

play12:50

Each database has a different data sovereignty architecture.

play12:53

It has different APIs, different capabilities,

play12:56

and a unique set of limitations.

play12:57

Application developers and IT

play12:59

strive to make every database comply

play13:01

with data sovereignty regulation and makes all data flow

play13:04

between database compliant.

play13:06

Oracle's Converged Database Architecture

play13:08

simplifies distributed databases.

play13:10

It provides a complete

play13:12

and a simple support for all modern data types, workloads,

play13:16

and development styles in one database

play13:19

with complete and simple consistency,

play13:21

scalability, and availability.

play13:23

It provides unified data sovereignty

play13:25

for all data types and workloads.

play13:28

Oracle recently released

play13:29

Oracle Globally Distributed Autonomous Database.

play13:33

It adds autonomous management

play13:34

to eliminate the operational complexity

play13:37

of a distributed database and reduces cost.

play13:39

It's a combination of Globally Distributed Database

play13:42

and Oracle Autonomous Database,

play13:44

which enables a Globally Distributed Autonomous Database,

play13:47

which is the simplest, most functional,

play13:50

most mission critical

play13:51

cloud-native distributed database service.

play13:53

Now let's take a look at the demo

play13:55

of Oracle Globally Distributed Autonomous Database.

play13:59

I'm logged into Oracle Cloud infrastructure console.

play14:02

From there, we'll quickly go through a flow

play14:05

of creating a Globally Distributed Autonomous Database.

play14:09

We provide a few options which we can leave

play14:12

to default, we don't want to change.

play14:15

Subsequently, we can configure how we want

play14:18

to distribute the data, whether we want to use automated

play14:21

or user-defined data distribution,

play14:24

and we can provide the number

play14:26

of shards we need in each of the locations.

play14:29

Optionally, we can use a map to pick the locations

play14:32

where we want to deploy shards.

play14:34

For example, I want to deploy some shards in Phoenix,

play14:38

some in London, some in Mumbai, some in Tokyo.

play14:43

Then we can configure each of these shard locations

play14:48

and specify how many shards we want in each location.

play14:51

For example, three shards in Phoenix,

play14:53

and I leave one in other regions.

play14:58

We can then specify the shape

play15:02

and the size for each of the shards

play15:03

and whether we need a replica or not.

play15:07

Here, I'm gonna select my shard one in Phoenix

play15:11

I want to deploy in availability domain one.

play15:14

We start with two ECPUs.

play15:16

We want to enable auto-scaling.

play15:18

This allows us to vertically scale each of the shards

play15:21

as the workload increases

play15:22

and conversely scale down if the workload decreases.

play15:25

We want to configure replication

play15:28

for the shard in a different region.

play15:30

I want to keep my US data within US,

play15:33

and I'll pick the US east,

play15:36

which is Ashburn as my replica location,

play15:40

and I want to put my replica in availability domain three.

play15:45

Likewise, I can configure rest of the shapes and sizes

play15:50

and replication for rest of the shards,

play15:52

and with a few clicks of a button,

play15:53

I will be able to create

play15:54

a Globally Distributed Autonomous Database.

play15:57

I'm gonna cancel out of this workflow and go back

play15:59

and look at a Globally Distributed Autonomous Database

play16:02

which has already been provisioned.

play16:03

For example, this database spans multiple locations

play16:07

including Hyderabad in India, Mumbai, Phoenix,

play16:11

Ashburn, et cetera.

play16:14

It's a single logical database

play16:16

and application connects to it using

play16:19

a single logical endpoint.

play16:21

Additionally, if you want to use auto wallet encryption,

play16:24

we can download the wallet and configure TLS.

play16:27

We can also visualize all the shards across the globe

play16:30

as a single logical database,

play16:33

and we can look at some of the performance metrics.

play16:35

Additionally, we have the ability to add a shard later,

play16:38

start the entire Globally Distributed Database,

play16:41

stop it, or terminate it, so on and so forth.

play16:44

Let's go back and look at some other concepts.

play16:47

Oracle brings natural language query

play16:49

to Globally Distributed Database

play16:51

using autonomous database Select AI

play16:54

that can translate natural language questions into SQL

play16:58

using an AI large learning model.

play17:01

The SQL query is automatically routed

play17:03

to the appropriate country

play17:04

or shard by the Globally Distributed Database.

play17:07

For example, if I want to ask a question,

play17:09

how many total streams

play17:10

for each Tom Cruise movies were viewed in India this month?

play17:14

In this case, the large learning model generates the SQL

play17:17

which already has country code as India,

play17:20

and hence, Oracle's Globally Distributed Database

play17:22

routes this query only to the shard in India.

play17:25

There are some exciting features coming soon

play17:28

in Oracle Database 23ai.

play17:31

One of them is Raft-based replication

play17:33

for extreme survivability.

play17:35

This is a new replication method that uses

play17:39

popular Raft quorum-based replication protocol.

play17:43

This provides automatic failover

play17:45

to a replica in under three seconds.

play17:48

It implements an active-active symmetric configuration.

play17:52

Each shard accepts writes and reads for a subset of data.

play17:56

It also delivers zero data loss using a high performance

play18:00

synchronous replication across shards.

play18:03

AI Vector Search and Retrieval Augmented Generations,

play18:07

are also available

play18:08

with Oracle's Globally Distributed Database 23ai.

play18:13

Oracle distributed database will add hyperscale

play18:16

and data sovereignty to Oracle Database's

play18:19

23ai Vector Search.

play18:22

Customers will be able

play18:23

to combine similarity search using AI vectors

play18:27

with search on business data about customers and products

play18:31

in a single distributed query.

play18:34

Here are the key takeaways.

play18:36

Oracle's Globally Distributed Database

play18:38

is the most fully featured distributed database.

play18:42

It provides more data distribution, replication,

play18:45

and deployment methods than any other database.

play18:47

Converged database architecture

play18:49

makes data sovereignty easy for modern applications

play18:52

that use multiple data types and workloads.

play18:55

The new 23ai Raft-based replication

play18:59

provides fast quorum-based failover.

play19:00

It supports leading-edge AI such as Vector Search

play19:04

and its autonomous capabilities remove complexity

play19:07

and reduce cost.

play19:08

Provides all the benefits

play19:10

of a distributed database without the compromises,

play19:13

so why settle for less?

Rate This

5.0 / 5 (0 votes)

Related Tags
Oracle分散データベーススケーラビリティデータソブリンティハイパースケール自動化クラウドエンジニアリングデータ管理AIセキュリティ
Do you need a summary in English?