ページがSeleniumでロードされるのを待つ方法

Selenium Webドライバーを使用したWeb自動化またはWebスクレイピング中に、選択する要素が使用できない、または押したいボタンをクリックする準備ができていないなどの問題が発生する場合があります。

これが発生する理由は、Selenium WebドライバーがWebページをダウンロードして、ページのレンダリングを完了してからでないと、何もできないためです。以前は、WebサーバーがWebサイトのコンテンツを生成し、ブラウザーがそれをダウンロードしてレンダリングしただけでした。最近では、動作が少し異なる単一ページのWebアプリが多数あります。シングルページWebアプリ（SPA）では、Webサーバーはフロントエンドコードのみを提供します。フロントエンドコードがブラウザでレンダリングされると、フロントエンドコードはAJAXを使用してAPIデータをウェブサーバーにリクエストします。フロントエンドがAPIデータを受信すると、ブラウザにレンダリングします。そのため、ブラウザがWebページのダウンロードとレンダリングを完了したとしても、Webページの準備はまだできていません。 APIデータを受信し、それらもレンダリングするのを待つ必要があります。したがって、この問題の解決策は、Seleniumで何かを行う前に、データが利用可能になるのを待つことです。

Seleniumには、2種類の待機があります。
1）暗黙の待機
2）明示的な待機

1）暗黙の待機： これは実装が最も簡単です。暗黙的な待機は、DOM（ドキュメントオブジェクトモデル）の準備が整う（Webページの準備が整う）まで数秒間待機するようにSeleniumWebドライバーに指示します。

2）明示的な待機： これは、暗黙の待機よりも少し複雑です。明示的な待機では、SeleniumWebドライバーに何を待機するかを指示します。 Seleniumは、その特定の条件が満たされるのを待ちます。それが実行されると、SeleniumWebドライバーは他のコマンドを実行できるようになります。通常、明示的な待機時間は可変です。それは、条件がどれだけ早く満たされるかに依存します。最悪のシナリオでは、明示的な待機は暗黙的な待機と同じくらい待機します。

この記事では、ページがSeleniumでロードされるのを（暗黙的および明示的に）待つ方法を紹介します。それでは、始めましょう。

前提条件：

この記事のコマンドと例を試すには、次のものが必要です。

1）コンピューターにインストールされているLinuxディストリビューション（できればUbuntu）。
2）コンピューターにインストールされているPython3。
3）コンピューターにインストールされているPIP3。
4）Python virtualenv コンピュータにインストールされているパッケージ。
5）コンピュータにインストールされているMozillaFirefoxまたはGoogleChromeWebブラウザ。
6）Firefox GeckoDriverまたはChromeWebDriverのインストール方法を知っている必要があります。

要件4、5、および6を満たすために、私の記事を読んでください Python3を使用したSeleniumの概要 Linuxhint.comで。

あなたは他のトピックに関する多くの記事を見つけることができます LinuxHint.com 。サポートが必要な場合は、必ずチェックしてください。

プロジェクトディレクトリの設定：

すべてを整理するには、新しいプロジェクトディレクトリを作成します セレン-待機/ 次のように：

$mkdir -pvセレン-待つ/運転手

に移動します セレン-待機/ 次のようにプロジェクトディレクトリ：

$CDセレン-待つ/

次のように、プロジェクトディレクトリにPython仮想環境を作成します。

$virtualenv .venv

次のように仮想環境をアクティブ化します。

$ソース.venv/午前/活性化

次のように、PIP3を使用してSeleniumをインストールします。

$ pip3インストールセレン

必要なすべてのWebドライバーをダウンロードしてインストールします。 運転手/ プロジェクトのディレクトリ。私の記事でWebドライバーをダウンロードしてインストールするプロセスを説明しました Python3を使用したSeleniumの概要 。サポートが必要な場合は、 LinuxHint.com その記事のために。

この記事のデモンストレーションには、Google ChromeWebブラウザーを使用します。だから、私は使用します chromedriver からのバイナリ 運転手/ ディレクトリ。

暗黙の待機を試すには、新しいPythonスクリプトを作成します ex01.py プロジェクトディレクトリに入力し、そのファイルに次のコード行を入力します。

からセレン輸入webdriver
からセレン。webdriver。一般。キー輸入キー
オプション=webdriver。ChromeOptions（（）。
オプション。ヘッドレス = NS
ブラウザ=webdriver。クロム（（実行可能パス='./drivers/chromedriver'、オプション=オプション）。
ブラウザ。暗黙的に_wait（（10）。
ブラウザ。得る（（「https://www.unixtimestamp.com/」）。
タイムスタンプ=ブラウザ。find_element_by_xpath（（'// h3 [@] [1]'）。
印刷（（'現在のタイムスタンプ：％s'％（（タイムスタンプ。文章。スプリット（（''）。[0]）。）。
ブラウザ。選ぶ（（）。

完了したら、 ex01.py Pythonスクリプト。

1行目と2行目は、必要なすべてのSeleniumコンポーネントをインポートします。

4行目はChromeオプションオブジェクトを作成します。

5行目では、ChromeWebドライバーのヘッドレスモードが有効になっています。

7行目では、 chromedriver からのバイナリ 運転手/ ディレクトリ。

8行目は、Seleniumに10秒間暗黙的に待機するように指示するために使用されます。 暗黙的に_wait（） ブラウザ方式。

10行目は、ブラウザにwww.unixtimestamp.comをロードします。

12行目は、XPathセレクターを使用してタイムスタンプ要素を検索します // h3 [@ class = ’text-danger’] [1] に保存します タイムスタンプ 変数。

ChromeデベロッパーツールからXPathセレクターを入手しました。ご覧のとおり、タイムスタンプは最初にあります h3 クラス名の要素 テキストの危険性 。 2つあります h3 クラスを持つ要素 テキストの危険性 。

13行目は、XPathセレクターを使用して選択し、に格納されている要素のタイムスタンプのみを出力します。 タイムスタンプ 変数。

14行目でブラウザを閉じます。

完了したら、Pythonスクリプトを実行します ex01.py 次のように：

$ python3ex01。py

ご覧のとおり、現在のタイムスタンプはunixtimestamp.comから抽出され、コンソールに出力されます。

明示的な待機の操作：

明示的な待機を試すには、新しいPythonスクリプトを作成します ex02.py プロジェクトディレクトリに入力し、そのファイルに次のコード行を入力します。

からセレン輸入webdriver
からセレン。webdriver。一般。キー輸入キー
からセレン。webdriver。一般。に輸入に
からセレン。webdriver。サポート。玉ねぎ輸入WebDriverWait
からセレン。webdriver。サポート輸入expected_conditions
オプション=webdriver。ChromeOptions（（）。
オプション。ヘッドレス = NS
ブラウザ=webdriver。クロム（（実行可能パス='./drivers/chromedriver'、オプション=オプション）。
ブラウザ。得る（（「https://www.unixtimestamp.com/」）。
試す：
タイムスタンプ=WebDriverWait（（ブラウザ、 10）。。それまで（（
expected_conditions。present_of_element_located（（（（に。XPATH、 '
// h3 [@] [1] '）。）。
）。
印刷（（'現在のタイムスタンプ：％s'％（（タイムスタンプ。文章。スプリット（（''）。[0]）。）。
ついに：
ブラウザ。選ぶ（（）。

完了したら、 ex02.py Pythonスクリプト。

1-5行目は、必要なすべてのコンポーネントをSeleniumライブラリからインポートします。

7行目はChromeオプションオブジェクトを作成します。

8行目では、ChromeWebドライバーのヘッドレスモードが有効になっています。

10行目では、 chromedriver からのバイナリ 運転手/ ディレクトリ。

12行目は、ブラウザにwww.unixtimestamp.comをロードします。

明示的な待機は、try-finallyブロック（14〜20行目）に実装されています。

15-17行目は作成を使用します WebDriverWait（） 物体。の最初の引数 WebDriverWait（） はブラウザオブジェクトであり、2番目の引数は条件を満たすための最大許容時間（最悪の場合のシナリオ）であり、この場合は10秒です。

の中に それまで（） ブロック、 expected_conditions.presence_of_element_located（） メソッドは、要素を選択する前に要素が存在することを確認するために使用されます。ここ、 By.XPATH を伝えるために使用されます present_of_element_located（） XPathセレクターを使用して要素を選択したメソッド。 XPathセレクターは // h3 [@ class = ’text-danger’] [1] 。

要素が見つかると、それはに保存されます タイムスタンプ 変数。

18行目は、選択した要素のタイムスタンプのみを出力します。

最後に、19〜20行目でブラウザを閉じます。

完了したら、 ex02.py 次のようなPythonスクリプト：

$ python3ex02。py

ご覧のとおり、unixtimestamp.comからの現在のタイムスタンプがコンソールに出力されます。

明示的な待機での要素の選択：

前のセクションで、私は使用しました By.XPATH XPathセレクターを使用して要素を選択するため。 ID、タグ名、CSSクラス名、CSSセレクターなどを使用して要素を選択することもできます。

サポートされている選択方法を以下に示します。

By.XPATH –XPathセレクターを使用して要素を選択します。

By.CLASS_NAME –CSSクラス名を使用して要素を選択します。

By.CSS_SELECTOR –CSSセレクターを使用して要素を選択します。

By.ID –IDで要素を選択します

名前で –名前で要素を選択します。

By.TAG_NAME –HTMLタグ名で要素を選択します。

By.LINK_TEXT –のリンクテキストで要素を選択しますに（アンカー）HTMLタグ。

By.PARTIAL_LINK_TEXT –の部分的なリンクテキストによって要素を選択しますに（アンカー）HTMLタグ。

これらの詳細については、次のWebサイトをご覧ください。 Python SeleniumAPIドキュメントページ。

明示的な待機で予想される条件：

以前の明示的な待機の例では、 present_of_element_located（） の方法 expected_conditions 選択する前に、探していた要素が存在することを確認するための明示的な待機条件として。

他にもあります expected_conditions 明示的な待機条件として使用できます。それらのいくつかは次のとおりです。

title_is（title） –ページのタイトルが題名。

title_contains（partial_title） –ページのタイトルにタイトルの一部が含まれているかどうかを確認します partial_title 。

可視性_of（要素） –かどうかを確認します エレメント 要素の幅と高さが0より大きいページにが表示されます。

可視性_of_element_located（ロケーター） -

present_of_element_located（locator） –要素が（ ロケータ ）がページに表示されます。 NS ロケータ のタプルです （By、セレクター）、 明示的な待機の例で示したように。

present_of_all_element_located（） –すべての要素が ロケータ ページにあります。 NS ロケータ は （By、セレクター） タプル。

text_to_be_present_in_element（locator、text） – 文章によって配置された要素に存在します ロケータ 。 NS ロケータ は （By、セレクター） タプル。

element_to_be_clickable（locator） –によって配置された要素があるかどうかを確認します ロケータ 表示され、クリック可能です。 NS ロケータ は （By、セレクター） タプル。

element_to_be_selected（locator） –によって配置された要素があるかどうかを確認します ロケータ が選択されています。 NS ロケータ は （By、セレクター） タプル。

alert_is_present（） –ページにアラートダイアログが表示されることを期待します。

もっとたくさんあります expected_conditions あなたが使用するために利用可能です。これらの詳細については、次のWebサイトをご覧ください。 Python SeleniumAPIドキュメントページ。

結論：

この記事では、Seleniumの暗黙的および明示的な待機について説明しました。また、暗黙的および明示的な待機を処理する方法も示しました。 Seleniumは待機時間を可能な限り短縮しようとするため、Seleniumプロジェクトでは常に明示的な待機を使用するようにしてください。これにより、Seleniumプロジェクトを実行するたびに特定の秒数を待つ必要がなくなります。明示的な待機により、多くの秒数を節約できます。

Selenium待機の詳細については、次のWebサイトをご覧ください。公式のSeleniumPythonライブラリがドキュメントページを待機しています。

ページがSeleniumでロードされるのを待つ方法

前提条件：

プロジェクトディレクトリの設定：

明示的な待機の操作：

明示的な待機での要素の選択：

明示的な待機で予想される条件：

結論：

カテゴリ

人気の投稿

SciPy Imshow

Bash でパスと拡張子なしでファイルのベース名を抽出する方法

GitHub リポジトリにフォルダを作成するにはどうすればよいですか?

Arduino Web Editor で Arduino ライブラリを追加する方法

Windows で Web カメラの黒い画面の問題をトラブルシューティングする方法?

ChatGPT の現在のステータスを確認するにはどうすればよいですか?

C++ XOR 演算

AWS 暗号化サービスの AWS CloudHSM とは何ですか?

2023 年に購入するのに適した Windows Phone はどれですか

AWS Lambda と AWS Amplify の違いは何ですか?

セカンダリインデックスを使用してデータアクセスを改善するにはどうすればよいですか?

SQL Server LEAD() 関数

Java が複数の例外をキャッチする

KDE Plasma デスクトップ環境を Debian 12 にインストールする方法

Java で Switch Case ステートメントを使用する方法

サーバー監視用に Raspberry Pi に Linux Dash をセットアップする方法

Docker でプログラミングを開始するにはどうすればよいですか

MATLABをクリアする方法

PowerShell と PSWindowsUpdate モジュールの概要

Discord Nitroでアニメーションアバターを設定する方法