Professional-Data-Engineer日本語試験無料問題集「Google Certified Professional Data Engineer Exam (Professional-Data-Engineer日本語版) 認定」

ページ: 1 / 30
トータル 380 問

サインアップ、ログインされた後に、試験全体を無料で表示できるようになります。

出題：1

地震データを分析するシステムを設計しています。抽出、変換、ロード（ETL）プロセスは、Apache Hadoop クラスター上で一連の MapReduce ジョブとして実行されます。ETL プロセスでは、一部のステップの計算コストが高いため、データセットの処理に数日かかります。その後、センサーのキャリブレーション手順が省略されていることが判明しました。将来的にセンサーのキャリブレーションを体系的に実行するために、ETL プロセスをどのように変更すればよいでしょうか。

A. シミュレーションを通じてアルゴリズムを開発し、キャリブレーション係数に基づいて最後の MapReduce ジョブからの出力データの分散を予測し、その修正をすべてのデータに適用します。

B. ETL プロセスの出力にセンサーのキャリブレーションデータを追加し、すべてのユーザーが自分でセンサーのキャリブレーションを適用する必要があることを文書化します。

C. 生データにセンサーのキャリブレーションを適用する新しい MapReduce ジョブを導入し、その後に他のすべての MapReduce ジョブが連鎖されるようにします。

D. transformMapReduce ジョブを変更して、他の操作を実行する前にセンサーのキャリブレーションを適用します。

正解：D 解答を投票する

出題：2

Google Cloud で推奨エンジンを使用するアプリケーションを開発しています。ソリューションでは、過去の視聴に基づいて新しい動画を顧客に表示する必要があります。ソリューションでは、顧客が視聴した動画内のエンティティのラベルを生成する必要があります。設計では、数 TB のデータに基づいて、他の顧客の好みのデータに基づいて非常に高速にフィルタリングの提案を提供できる必要があります。どうすればよいでしょうか。

A. Spark MLlib を使用して分類モデルを構築およびトレーニングし、ラベルを生成します。Spark MLlib を使用して 2 番目の分類モデルを構築およびトレーニングし、顧客の好みに合わせて結果をフィルタリングします。Cloud Dataproc を使用してモデルをデプロイします。アプリケーションからモデルを呼び出します。

B. Cloud Video Intelligence API を呼び出してラベルを生成するアプリケーションを構築します。データを Cloud SQL に保存し、予測されたラベルを結合してフィルタリングし、ユーザーの視聴履歴と一致させて好みを生成します。

C. Spark MLlib を使用して複雑な分類モデルを構築およびトレーニングし、ラベルを生成して結果をフィルタリングします。
Cloud Dataproc を使用してモデルをデプロイします。アプリケーションからモデルを呼び出します。

D. Cloud Video Intelligence API を呼び出してラベルを生成するアプリケーションを構築します。データを Cloud Bigtable に保存し、予測されたラベルをユーザーの視聴履歴に合わせてフィルタリングして、好みを生成します。

正解：D 解答を投票する

出題：3

Google Dataproc で使用するサービスアカウントに必要な最小限の権限は何ですか?

A. Google Cloud Storage に実行し、Google Cloud Logging に書き込みます。

B. Google Cloud Storage に実行、Google Cloud Logging に実行

C. Google Cloud Storage に書き込み、Google Cloud Logging に読み取ります

D. Google Cloud Storage への読み取りと書き込み、Google Cloud Logging への書き込み

正解：D 解答を投票する

解説: (GoShiken メンバーにのみ表示されます)

出題：4

Pub/Sub トピックから読み取る Apache Beam 処理パイプラインを設計しました。トピックのメッセージ保持期間は 1 日で、Cloud Storage バケットに書き込みます。RPO が 15 分であるリージョン停止が発生した場合にデータ損失を防ぐには、バケットの場所と処理戦略を選択する必要があります。どうすればよいでしょうか。

A. 1 マルチリージョンの Cloud Storage バケットを使用する
2 Cloud Monitoring を使用して Dataflow 指標を監視し、いつ停止が発生したかを判断する
3 確認済みのメッセージを回復するために、サブスクリプションを60分前に戻す
4 セカンダリリージョンでデータフロージョブを開始する

B. 1. ターボレプリケーションを有効にしたデュアルリージョンの Cloud Storage バケットを使用する
2 Cloud Monitoring を使用して Dataflow 指標を監視し、いつ停止が発生したかを判断する
3 確認済みのメッセージを回復するために、サブスクリプションを60分前に戻す
4 セカンダリリージョンで Dataflow ジョブを開始します。

C. 1 リージョンの Cloud Storage バケットを使用する
2 Cloud Monitoring を使用して Dataflow 指標を監視し、いつ停止が発生したかを判断する
3 確認済みのメッセージを回復するために、サブスクリプションを1日前まで遡って検索する
4 セカンダリリージョンでデータフロージョブを開始し、同じリージョンのバケットに書き込む

D. 1. デュアルリージョンの Cloud Storage バケットを使用します。
2. Cloud Monitoring を使用して Dataflow 指標を監視し、いつ停止が発生したかを判断する
3 確認済みのメッセージを回復するために、サブスクリプションを15分前に戻す
4 セカンダリリージョンでデータフロージョブを開始する

正解：D 解答を投票する

解説: (GoShiken メンバーにのみ表示されます)

出題：5

会社では、カンマ区切り値 (CSV) ファイルを Google BigQuery にロードしています。データは完全に正常にインポートされましたが、インポートされたデータはソースファイルとバイト単位で一致していません。この問題の原因として最も可能性が高いのは何でしょうか。

A. BigQuery にロードされた CSV データには CSV のフラグが付けられていません。

B. BigQuery にロードされた CSV データは、BigQuery のデフォルトのエンコードを使用していません。

C. CSV データには、インポート時にスキップされた無効な行が含まれています。

D. CSV データは、BigQuery にロードされる前に ETL フェーズを経ていません。

正解：C 解答を投票する

出題：6

Cloud Datastore を使用して、車両のテレメトリデータをリアルタイムで取り込むことにしました。コストを抑えながら、長期的なデータの増加に対応できるストレージシステムを構築したいと考えています。また、ポイントインタイム (PIT) リカバリを実行できるように、または別の環境で Cloud Datastore のデータのコピーをクローンできるように、定期的にデータのスナップショットを作成したいと考えています。これらのスナップショットを長期間アーカイブしたいと考えています。これを実現するには、どの 2 つの方法がありますか。回答を 2 つ選択してください。

A. マネージドエクスポートを使用し、そのエクスポート用に予約された一意の名前空間の下にある別のプロジェクトの Cloud Datastore にインポートします。

B. マネージドエクスポートを使用し、Nearline または Coldline クラスを使用してデータを Cloud Storage バケットに保存します。

C. Cloud Datastore クライアントライブラリを使用してすべてのエンティティを読み取るアプリケーションを作成します。エクスポートされたデータを JSON ファイルにフォーマットします。データを Cloud Source Repositories に保存する前に圧縮を適用します。

D. Cloud Datastore クライアントライブラリを使用してすべてのエンティティを読み取るアプリケーションを作成します。BigQuery ストリーミング挿入を介して各エンティティを BigQuery テーブルの行として扱います。各エクスポートにエクスポートタイムスタンプを割り当て、各行の追加列として添付します。エクスポートタイムスタンプ列を使用して BigQuery テーブルがパーティション分割されていることを確認します。

E. マネージドエクスポートを使用し、そのエクスポート専用に作成された BigQuery テーブルにデータをインポートし、一時エクスポートファイルを削除します。

正解：C,E 解答を投票する

出題：7

BigQuery で非正規化データ構造を使用する 2 つの利点は何ですか?

A. 処理されるデータの量を減らし、クエリ速度を向上します

B. 必要なストレージ量を削減し、クエリ速度を向上します

C. 処理されるデータの量を減らし、必要なストレージの量を減らします

D. クエリ速度が向上し、クエリがシンプルになります

正解：D 解答を投票する

解説: (GoShiken メンバーにのみ表示されます)

出題：8

外部の顧客が、データベースから毎日データをダンプして提供します。データは、カンマ区切り値 (CSV) ファイルとして Google Cloud Storage GCS に流れ込みます。このデータを Google BigQuery で分析したいのですが、データに形式が誤っている行や破損している行が含まれている可能性があります。このパイプラインをどのように構築すればよいでしょうか。

A. フェデレーションデータソースを使用し、SQL クエリでデータをチェックします。

B. gcloud CLI を使用してデータを BigQuery にインポートし、max_bad_records を 0 に設定します。

C. Google Cloud Dataflow バッチパイプラインを実行してデータを BigQuery にインポートし、エラーを別のデッドレターテーブルにプッシュして分析します。

D. Google Stackdriver で BigQuery モニタリングを有効にし、アラートを作成します。

正解：C 解答を投票する

出題：9

Dataflow パイプラインを使用して注文データをストリーミングし、集計結果を Memorystore に書き込みます。Basic Tier の Memorystore for Redis インスタンスをプロビジョニングしました。4 GB の容量で、40 のクライアントが読み取り専用アクセスに使用します。読み取り専用クライアントの数は数百に大幅に増加すると予想されており、需要に対応できる必要があります。読み取りおよび書き込みアクセスの可用性が影響を受けないようにし、変更を迅速にデプロイできるようにする必要があります。どうすればよいでしょうか。

A. 基本階層 (4 GB 容量) の新しい Memorystore for Redis インスタンスを複数作成し、すべてのインスタンスを使用するように Dataflow パイプラインと新しいクライアントを変更します。

B. Memcached インスタンス用の新しい Memorystore を作成します。ノードを最低 3 つ設定し、ノードあたりのメモリを 4 GB に設定します。Dataflow パイプラインとすべてのクライアントを変更して、Memcached インスタンスを使用します。古いインスタンスを削除します。

C. 標準階層で新しい Memorystore for Redis インスタンスを作成します。容量を 5 GB に設定し、複数の読み取りレプリカを作成します。古いインスタンスを削除します。

D. 標準階層で新しい Memorystore for Redis インスタンスを作成します。容量を 4 GB に設定し、読み取りレプリカを読み取りレプリカなし (高可用性のみ) に設定します。古いインスタンスを削除します。

正解：C 解答を投票する

解説: (GoShiken メンバーにのみ表示されます)

出題：10

SQL パイプラインを作成する必要があります。パイプラインは、2 時間ごとに BigQuery テーブルで集計 SOL 変換を実行し、その結果を別の既存の BigQuery テーブルに追加します。エラーが発生した場合に再試行するようにパイプラインを構成する必要があります。パイプラインが 3 回連続して失敗した場合に電子メール通知を送信するようにします。どうすればよいでしょうか。

A. Cloud Composer で BigQueryUpsertTableOperator を使用し、再試行パラメータを 3 に設定し、email_on_failure パラメータを true に設定します。

B. 2 時間ごとに繰り返すスケジュールオプションを使用して SQL 変換を実行する BigQuery スケジュールクエリを作成し、Pub/Sub トピックへの通知を有効にします。Pub/Sub と Cloud Functions を使用して、3 回の末尾実行後にメールを送信します。

C. Cloud Composer で BigQuerylnsertJobOperator を使用し、再試行パラメータを 3 に設定し、email_on_failure パラメータを true に設定します。

D. 2 時間ごとに繰り返すスケジュールオプションを使用して SOL 変換を実行する BigQuery スケジュールクエリを作成し、電子メール通知を有効にします。

正解：B 解答を投票する

解説: (GoShiken メンバーにのみ表示されます)

出題：11

オンプレミスの Apache Hadoop クラスタで何千もの Apache Spark ジョブが実行されています。ジョブを Google Cloud に移行したいと考えています。長期間稼働する Hadoop クラスタを自分で管理するのではなく、マネージドサービスを使用してジョブを実行したいと考えています。スケジュールが厳しく、コードの変更を最小限に抑えたいと考えています。どうすればよいでしょうか。

A. Apache Beam でジョブを書き換えます。Dataflow でジョブを実行します。

B. データを Cloud Storage に移動します。ジョブを Dataproc で実行します。

C. データを Compute Engine ディスクにコピーします。これらのインスタンスで直接ジョブを管理および実行します。

D. データを BigQuery に移動します。Spark スクリプトを SQL ベースの処理アプローチに変換します。

正解：B 解答を投票する

解説: (GoShiken メンバーにのみ表示されます)

出題：12

ニューラルネットワークにカテゴリ特徴のカテゴリ間の関係を学習させるにはどうすればよいでしょうか?

A. ハッシュバケットを作成する

B. 埋め込み列を作成する

C. ワンホット列を作成する

D. マルチホット列を作成する

正解：B 解答を投票する

解説: (GoShiken メンバーにのみ表示されます)

出題：13

すべての Google Cloud Bigtable クライアントリクエストはフロントエンドサーバーを経由して Cloud Bigtable ノードに送信されます。

A. の場合のみ

B. 1回

C. 前

D. 後

正解：C 解答を投票する

解説: (GoShiken メンバーにのみ表示されます)

ページ: 1 / 30
トータル 380 問

Professional-Data-Engineer日本語の機能をすべて解除する

キャプチャ不要
365日無料更新サービス
希望する合格率を設定できる
時間の割り当てられる（時間：分）
Professional-Data-Engineer日本語に2つの練習用モード
サポートサービス対応

完全版を入手する

弊社のサイトにはあなたの試験合格を助けるために研究された効果的な知能問題集を提供しています。材料はすべてのユーザーによって称賛されています。弊社のサイトは、最短時間で多くの証明書を取得するのに役立つ学習プラットフォームになります。

掲示板

試験HPE0-V25J トピック7 問題118 スレッド
試験UiPath-ADAv1 トピック20 問題174 スレッド
試験HPE0-V25J トピック1 問題34 スレッド
試験PMI-RMP トピック8 問題7 スレッド
試験PMI-ACP-JPN トピック1 問題428 スレッド
試験GitHub-Copilot トピック5 問題65 スレッド
試験SC-300J トピック1 問題357 スレッド

弊社を連絡する

我々の働いている時間：( UTC+9 ) 9:00-24:00

月曜日から土曜日まで

サポート：現在連絡

我々は１２時間以内ですべてのお問い合わせを答えます。