DP-100日本語試験無料問題集「Microsoft Designing and Implementing a Data Science Solution on Azure (DP-100日本語版) 認定」
一連のCSVファイルには売上記録が含まれています。すべてのCSVファイルは同じデータスキーマを持っています。
各CSVファイルには、特定の月の売上記録が含まれており、ファイル名はsales.csvです。各ファイルは、データが記録された月と年を示すフォルダーに保存されます。これらのフォルダーは、Azure Machine Learningワークスペースでデータストアが定義されているAzure BLOBコンテナー内にあります。フォルダーは、salesという名前の親フォルダーの下に整理され、次の階層構造を形成します。

毎月末に、その月の販売ファイルを含む新しいフォルダが販売フォルダに追加されます。
次の要件に基づいて、販売データを使用して機械学習モデルをトレーニングする予定です。
これまでのすべての販売データをデータフレームに簡単に変換できる構造に読み込むデータセットを定義する必要があります。
特定の月より前に作成されたデータのみを使用し、その月以降に追加されたデータは無視する実験を作成できる必要があります。
可能な限り最小限の数のデータセットを登録する必要があります。
販売データを Azure Machine Learning サービス ワークスペースのデータセットとして登録する必要があります。
何をすべきでしょうか?
各CSVファイルには、特定の月の売上記録が含まれており、ファイル名はsales.csvです。各ファイルは、データが記録された月と年を示すフォルダーに保存されます。これらのフォルダーは、Azure Machine Learningワークスペースでデータストアが定義されているAzure BLOBコンテナー内にあります。フォルダーは、salesという名前の親フォルダーの下に整理され、次の階層構造を形成します。

毎月末に、その月の販売ファイルを含む新しいフォルダが販売フォルダに追加されます。
次の要件に基づいて、販売データを使用して機械学習モデルをトレーニングする予定です。
これまでのすべての販売データをデータフレームに簡単に変換できる構造に読み込むデータセットを定義する必要があります。
特定の月より前に作成されたデータのみを使用し、その月以降に追加されたデータは無視する実験を作成できる必要があります。
可能な限り最小限の数のデータセットを登録する必要があります。
販売データを Azure Machine Learning サービス ワークスペースのデータセットとして登録する必要があります。
何をすべきでしょうか?
正解:C
解答を投票する
解説: (GoShiken メンバーにのみ表示されます)
Azure Machine Learning ワークスペースを管理しています。model1 というモデルをトレーニングします。
異なるモデル予測結果を得るためには、変更する機能を特定する必要があります。
model1 の Responsible Al (RAI) ダッシュボードを構成する必要があります。
どの 3 つのアクションを順番に実行する必要がありますか? 回答するには、適切なアクションをアクション リストから回答領域に移動し、正しい順序に並べます。

異なるモデル予測結果を得るためには、変更する機能を特定する必要があります。
model1 の Responsible Al (RAI) ダッシュボードを構成する必要があります。
どの 3 つのアクションを順番に実行する必要がありますか? 回答するには、適切なアクションをアクション リストから回答領域に移動し、正しい順序に並べます。

正解:

Explanation:

機械学習モデルが、敏感な特徴にわたって不公平な予測を生成することがあります。
モデルの不公平さを軽減するには、後処理テクニックを使用してモデルに制約を適用する必要があります。
後処理手法とモデル タイプを選択する必要があります。
何を使うべきでしょうか? 回答するには、回答エリアで適切なオプションを選択してください。
注意: 正しい選択ごとに 1 ポイントが付与されます。

モデルの不公平さを軽減するには、後処理テクニックを使用してモデルに制約を適用する必要があります。
後処理手法とモデル タイプを選択する必要があります。
何を使うべきでしょうか? 回答するには、回答エリアで適切なオプションを選択してください。
注意: 正しい選択ごとに 1 ポイントが付与されます。

正解:

Explanation:

Workspace^ というAzure Machine Learningワークスペースがあります。Workspace1には、PyFuncフレーバーの model1 というMLflowモデルが登録されています。Azure Machine Learning Python SDK v2を使用して、egress接続なしで、endpoint1というオンラインエンドポイントに model1 をデプロイする予定です。次のコードがあります。

モデルが正常にデプロイされるようにするには、ManagedOnlineDeployment オブジェクトにパラメーターを追加する必要があります。
解決策: code_path パラメータを追加します。
ソリューションは目標を満たしていますか?

モデルが正常にデプロイされるようにするには、ManagedOnlineDeployment オブジェクトにパラメーターを追加する必要があります。
解決策: code_path パラメータを追加します。
ソリューションは目標を満たしていますか?
正解:B
解答を投票する
注: この問題は、同じシナリオを提示する一連の問題の一部です。一連の問題にはそれぞれ、定められた目標を満たす可能性のある独自の解答が含まれています。問題セットによっては、複数の正解が存在する場合もあれば、正解がない場合もあります。
このセクションの質問に回答した後は、その質問に戻ることはできません。そのため、これらの質問はレビュー画面に表示されません。
ワークスペースにAzure Machine Learningサービスのデータストアを作成します。データストアには以下のファイルが含まれます。
* /data/2018/Q1 .csv
* /データ/2018/Q2.csv
* /データ/2018/Q3.csv
* /データ/2018/Q4.csv
* /データ/2019/Q1.csv
すべてのファイルは、次の形式でデータを保存します。
id,f1,f2,l
1、1、2、0
2、1、1、1
3.2.1.0
次のコードを実行します。

次のコードを使用して、training_data という名前のデータセットを作成し、すべてのファイルからデータを 1 つのデータ フレームにロードする必要があります。

解決策: 次のコードを実行します。

ソリューションは目標を満たしていますか?
このセクションの質問に回答した後は、その質問に戻ることはできません。そのため、これらの質問はレビュー画面に表示されません。
ワークスペースにAzure Machine Learningサービスのデータストアを作成します。データストアには以下のファイルが含まれます。
* /data/2018/Q1 .csv
* /データ/2018/Q2.csv
* /データ/2018/Q3.csv
* /データ/2018/Q4.csv
* /データ/2019/Q1.csv
すべてのファイルは、次の形式でデータを保存します。
id,f1,f2,l
1、1、2、0
2、1、1、1
3.2.1.0
次のコードを実行します。

次のコードを使用して、training_data という名前のデータセットを作成し、すべてのファイルからデータを 1 つのデータ フレームにロードする必要があります。

解決策: 次のコードを実行します。

ソリューションは目標を満たしていますか?
正解:A
解答を投票する
解説: (GoShiken メンバーにのみ表示されます)
CSVファイルからテキストを前処理する予定です。Azure Machine Learning Studioのデフォルトのストップワードリストを読み込みます。
次の要件を満たすように Preprocess Text モジュールを構成する必要があります。
複数の関連単語が単一の標準形式から抽出されていることを確認します。
テキストからパイプ文字を削除します。
情報検索を最適化するために単語を削除します。
どの 3 つのオプションを選択する必要がありますか? 回答するには、回答領域で適切なオプションを選択してください。
注意: 正しい選択ごとに 1 ポイントが付与されます。

次の要件を満たすように Preprocess Text モジュールを構成する必要があります。
複数の関連単語が単一の標準形式から抽出されていることを確認します。
テキストからパイプ文字を削除します。
情報検索を最適化するために単語を削除します。
どの 3 つのオプションを選択する必要がありますか? 回答するには、回答領域で適切なオプションを選択してください。
注意: 正しい選択ごとに 1 ポイントが付与されます。

正解:

Explanation:

Box 1: Remove stop words
Remove words to optimize information retrieval.
Remove stop words: Select this option if you want to apply a predefined stopword list to the text column.
Stop word removal is performed before any other processes.
Box 2: Lemmatization
Ensure that multiple related words from a single canonical form.
Lemmatization converts multiple related words to a single canonical form Box 3: Remove special characters Remove special characters: Use this option to replace any non-alphanumeric special characters with the pipe | character.
References:
https://docs.microsoft.com/en-us/azure/machine-learning/studio-module-reference/preprocess-text
注:この質問は、同じシナリオを提示する一連の質問の一部です。シリーズの各質問には、述べられた目標を達成する可能性のある独自の解決策が含まれています。一部の質問セットには複数の正しい解決策がある場合がありますが、他の質問セットには正しい解決策がない場合があります。
このセクションの質問に回答した後は、その質問に戻ることはできません。その結果、これらの質問はレビュー画面に表示されません。
Pythonスクリプトを使用して、Azure MachineLearningの実験を実行することを計画しています。スクリプトは、実験実行コンテキストへの参照を作成し、ファイルからデータをロードし、ラベル列の一意の値のセットを識別して、実験実行を完了します。
azureml.coreからインポート実行
パンダをpdとしてインポートする
run = Run.get_context()
データ= pd.read_csv( 'data.csv')
label_vals = data ['label']。unique()
#ここに指標を記録するコードを追加
run.complete()
実験では、後で確認できる実行のメトリックとして、データ内の一意のラベルを記録する必要があります。
コメントで示されたポイントで実行メトリックとして一意のラベル値を記録するには、スクリプトにコードを追加する必要があります。
解決策:コメントを次のコードに置き換えます。
run.upload_file( 'outputs / labels.csv'、 '。/ data.csv')
ソリューションは目標を達成していますか?
このセクションの質問に回答した後は、その質問に戻ることはできません。その結果、これらの質問はレビュー画面に表示されません。
Pythonスクリプトを使用して、Azure MachineLearningの実験を実行することを計画しています。スクリプトは、実験実行コンテキストへの参照を作成し、ファイルからデータをロードし、ラベル列の一意の値のセットを識別して、実験実行を完了します。
azureml.coreからインポート実行
パンダをpdとしてインポートする
run = Run.get_context()
データ= pd.read_csv( 'data.csv')
label_vals = data ['label']。unique()
#ここに指標を記録するコードを追加
run.complete()
実験では、後で確認できる実行のメトリックとして、データ内の一意のラベルを記録する必要があります。
コメントで示されたポイントで実行メトリックとして一意のラベル値を記録するには、スクリプトにコードを追加する必要があります。
解決策:コメントを次のコードに置き換えます。
run.upload_file( 'outputs / labels.csv'、 '。/ data.csv')
ソリューションは目標を達成していますか?
正解:B
解答を投票する
解説: (GoShiken メンバーにのみ表示されます)