RのSample()関数

Rnosample Guan Shu



R では、sample() 関数を使用して、ベクトルまたはリストからランダムにサンプル値を取得します。これにより、多くの統計アプリケーションで役立つデータのサブセットをランダムに選択できるようになります。入力がsample()関数のリストである場合、出力も同じ数の要素を含む、選択された要素を含むリストになります。この記事では、さまざまな引数を設定する実装を備えた R のsample() 関数を示します。

例 1: データ引数を指定した Sample() 関数の使用

R のsample() 関数には、ランダムに数値を生成するサンプル データを指定する必要があります。サンプル データは、sample() 関数の必須引数であり、そのコードを次に示します。

データX < -c ( 10 二十 30 40 50 60 70 80 90 100 )

サンプル ( データX 3 )

サンプル ( データX 3 )

ここでは、まず「dataX」変数内の整数要素のベクトルを生成します。次に、コード内でsample()関数を2回呼び出し、以前に生成した「dataX」ベクトルを引数として渡します。最初のサンプル (dataX, 3) の使用では、「dataX」ベクトルから 3 つの要素のランダムなサンプルが取得されます。結果は、「dataX」の 3 つの要素をランダムに並べたものです。その後、「dataX」ベクトルから 3 つの要素の別の独立したランダム サンプルを取得する、sample(a, 5) を再度使用します。今回の結果は前回とは全く異なります。







出力には、sample() 関数を 2 回呼び出したときのさまざまな要素が表示されます。サンプルをランダムに作成するたびに、ベクトルから異なる要素が取得されることに注意してください。





例 2: Replace 引数を指定した Sample() 関数の使用

さらに、論理値を受け取るsample()関数の「replace」引数があります。要素が置換オプション TRUE でサンプリングされる場合、同様の要素を複数回選択できます。ただし、値が FALSE に設定されている場合、各要素の選択は 1 つだけであるため、要素は置換されずにサンプリングされます。





乱数 = c ( 十一 25 12 89 4.5 16 67 38 96 55 73 )

サンプル ( 乱数 4 交換 = 真実 )

サンプル ( 乱数 5 交換 = 真実 )

ここでは、まず「random_numbers」変数内のいくつかの数値を使用してベクトルを定義します。その後、sample() 関数を呼び出し、「random_numbers」を引数として渡します。値「4」は、「random_numbers」のベクトルからランダムな値を 4 つだけ選択することを示す、sample() 関数に指定されています。

次に、sample() 関数の replace=TRUE は、各値を複数回選択できることを指定します。次に、今度はベクトルから「5」個のランダムな値を選択する、sample() 関数を再度デプロイします。同様に、各値の複数選択オプションについても、以前と同様に replace 引数を「TRUE」に設定します。



ご覧のとおり、最初の出力には、「random_numbers」ベクトルからランダムに選択された 4 つの要素のベクトルが表示されます。ただし、次の出力では、ランダムに選択された「5」要素のベクトルが表示されます。

例 3: サイズ引数を指定した Sample() 関数の使用

Sample() 関数が渡す次の引数は「サイズ」です。 「サイズ」は、抽出されるサンプルの値を示すオプションのパラメーターです。 「size」パラメータを指定したsample()関数のコードを以下に示します。

ベクトル < - 1 : 10

サンプル ( ベクトル サイズ = 5 )

ここで、数値ベクトルは、「vectors」変数内の 1 から 10 までの整数のシーケンスとして定義されます。次に、sample() 関数を使用して、ベクトルから要素をランダムに選択します。見てわかるように、sample() 関数は 2 つの引数を取ります。最初の引数は、サンプルを取得するベクトルです。次の引数はサイズで、値「5」で指定されます。これは、ベクトルから選択する要素が 5 つだけであることを示します。

したがって、選択された要素は、次の出力の新しいベクトルとしてランダムな順序で返されます。

例 4: R リストに対する Sample() 関数の使用

さらに、sample() 関数を R のリストに使用できます。例のこのセクションでは、リストからランダムな値を取得します。

R_リスト < - リスト ( 1 : 4

913

c ( 'バツ' 「○○」 '良い' )

「ZZZ」

5 )

結果 < - R_リスト [ サンプル ( 1 :長さ ( R_リスト ) サイズ = 4 ) ]

結果

ここで、「R_list」のリストは、数値ベクトル、単一の数値、文字ベクトル、文字列、その他の数値など、さまざまな種類の要素で定義されます。その後、sample() 関数が呼び出される「結果」変数を作成します。

Sample() 関数内で、サンプリングするインデックスのベクトルを示す「1:length(R_list)」式を設定します。次に、サンプリングする要素の数を指定する「size」引数「4」があります。したがって、「R_list」は、「R_list」のリストからランダムに選択された 3 つの要素を生成します。 「R_list」のリスト内の要素は異なる型であるため、「result」内の結果の要素も異なる型になる可能性があります。

出力は、元のリストのランダムなサブセットを含む新しいリストを表します。

例 5: Prob 引数を指定した Sample() 関数の使用

さらに、sample() 関数の「prob」パラメータもあります。 「prob」引数は、ベクトル内の選択された要素の確率を与えます。 「prob」引数が使用されていない場合、すべての要素の確率が等しいと想定されることに注意してください。

私のデータ = c ( 31 99 5 24 72

サンプル ( 私のデータ サイズ = 10 交換 = 真実

問題 = c ( 0.5 担当者 ( 0.1 4

ここで、数値ベクトルの要素を「my_data」と呼びます。次のステップでは、sample() 関数を呼び出し、「my_data」がランダムに選択された 10 個の要素に渡されます。次に、ランダムに選択する値のサイズが「10」であることを指定する「size」引数が定義されます。その後、「replace」引数に「TRUE」を割り当てます。これは、選択された各要素が次の要素を選択する前にベクトルに置き換えられることを意味します。 Sample() 関数で定義される 3 番目の引数は「prob」で、「my_data」ベクトル内の各要素が選択される確率を定義します。最初の要素の確率は「0.5」に設定されます。残りの 4 つのベクトル要素の確率は「0.1」です。

次の出力は、予想どおり、ベクトル内の最初の要素の最も高い確率で取得されます。

例 6: Sample() 関数を使用して棒グラフをレンダリングする

最後に、sample() 関数を使用して R で棒グラフを構築し、特定の確率分布でカテゴリカル変数の分布を視覚化します。

サンプルデータ = c ( 1 2 3

棒グラフ ( テーブル ( サンプル ( サンプルデータ サイズ = 500 交換 = 真実 問題 = c ( .30 .60 .10

ここでは、整数値のベクトルで「sample_data」を定義した後、sample() 関数をデプロイしてバープロットを生成します。まず、table() 関数を呼び出す barplot を呼び出して、結果のサンプルの度数表を作成します。次に、table() 関数内で、sample() 関数を指定します。この関数では、サイズ 1000 のランダム サンプルが整数 1 ~ 3 のベクトルから抽出されます。次に、「prob」引数を使用して、各整数が選択される確率を指定します。 。

ここでわかるように、バープロットは次のように 3 つのバー (各整数に 1 つずつ) でレンダリングされ、バーの高さはサンプル内で発生する整数に関連しています。

結論

さまざまな例で、sample() 関数がどのように動作するかを見てきました。 sample() 関数は、サンプル データが必要な場合にさまざまな引数とともに使用されますが、他のすべての引数はオプションであり、特定の場合に呼び出されます。ただし、sample() 関数は、統計分析や大規模なデータセットを操作する場合に役立ちます。