Python

PythonでXPathを利用しXML形式の文書から特定の要素を抽出する方法を現役エンジニアが解説【初心者向け】

初心者向けにPythonでXPathを利用する方法について現役エンジニアが解説しています。XPathとはXML形式の文書から特定の要素を抽出するための言語のことです。Pythonではlxmlというパッケージを使います。Webスクレイピングなどに使うことが出来ます。

テックアカデミーマガジンは受講者数No.1のプログラミングスクール「テックアカデミー」が運営。初心者向けにプロが解説した記事を公開中。現役エンジニアの方はこちらをご覧ください。 ※ アンケートモニター提供元：GMOリサーチ株式会社　調査期間：2021年8月12日～8月16日　調査対象：2020年8月以降にプログラミングスクールを受講した18～80歳の男女1,000名　調査手法：インターネット調査

PythonでXPathを利用する方法について、TechAcademyのメンター（現役エンジニア）が実際のコードを使用して、初心者向けに解説します。

Pythonについてそもそもよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が深まります。

なお本記事は、TechAcademyのオンラインブートキャンプ、Python講座の内容をもとに紹介しています。

今回は、Pythonに関する内容だね！

どういう内容でしょうか？

PythonでXPathを利用する方法について詳しく説明していくね！

お願いします！

XPathとは

XPathとは、XML Path Languageの略でXML形式の文書から特定の要素を抽出するための言語のことです。

XMLはHTMLの形式とよく似ており、HTMLにも対応しています。Webからデータ情報を収集する際に用いられるスクレイピングはまさにXPathを使って要素の抽出を行っています。

これからWebスクレイピングを始めたい方はXPathを知っておくといいでしょう。

lxmlのxpath関数の使い方

lxmlはPythonでXML構文を解析するためのパッケージになっています。pipでインストールする必要があるので以下の1行でインストールできます。

pip install lxml

まずは解析したい文書の形式を指定する必要があります。冒頭でも述べたとおり、lxmlではHTMLやXMLのデータを読み込むことができます。

そこで今回は実際のスクレイピングを想定してHTMLを読み込む方法を紹介します。まずは、HTMLを読み込むためにPythonの標準モジュールであるurllibをつかってHTMLをしゅとくします。なお、今回はexample.comを題材にHTMLの読み込みを行います。それでは、example.comのHTMLソースを取得していきます。

from urllib import request

source = request.urlopen("https://example.com")
data = source.read()
print(data.decode())

ここまででexample.comのHTMLの中身を見ることができるようになったと思います。ここからlxmlの出番です。先程読み込んだHTMLのデータを文字列として読み込んで、 html.fromstringでXPathを使える状態にします。

load_html = html.fromstring(str(data))

いよいよHTMLから要素を抽出しますが、ここで抽出するデータをXPathで指定する方法を紹介します。先程urllibで取得したHTMLを見てみます。

<!doctype html>
<html>
    <head>
        <title>Example Domain</title>

        <meta charset="utf-8" />
        <meta http-equiv="Content-type" content="text/html; charset=utf-8" />
        <meta name="viewport" content="width=device-width, initial-scale=1" />
        <style type="text/css">
            body {
                background-color: #f0f0f2;
                margin: 0;
                padding: 0;
                font-family: -apple-system, system-ui, BlinkMacSystemFont, "Segoe UI", "Open Sans", "Helvetica Neue", Helvetica, Arial, sans-serif;
           }
           div {
               width: 600px;
               margin: 5em auto;
               padding: 2em;
               background-color: #fdfdff;
               border-radius: 0.5em;
               box-shadow: 2px 3px 7px 2px rgba(0,0,0,0.02);
           }
           a:link, a:visited {
               color: #38488f;
               text-decoration: none;
           }
           @media (max-width: 700px) {
               div {
                   margin: 0 auto;
                   width: auto;
               }
           }
        </style>
    </head>

    <body>
        <div>
            <h1>Example Domain</h1>
            <p>This domain is for use in illustrative examples in documents. You may use this
            domain in literature without prior coordination or asking for permission.</p>
            <p><a href="https://www.iana.org/domains/example">More information...</a></p>
        </div>
    </body>
</html>

HTMLを書いたことある方ならご存知のことですが、HTMLはタグによってツリー構造になっており、サイトによってその構造が違います。

今回はこの中からh1タグに記載されている内容を取り出してみます。h1タグの中身を取り出すときには、html.xpath関数で//h1と指定すると取り出せます。また、xpath関数の戻り値はリストになっているのでh1データをすべて表示させるときはfor文を使うといいです。更にタグの中身を出すには、.textを付け加えます。

したがって中身を取り出すときは以下のコードになります。

h1_content = load_html.xpath("//h1")
# タグの中身を取得
for content in h1_content:
    print(content.text)

[PR] Pythonで挫折しない学習方法を動画で公開中

実際に書いてみよう

先ほど紹介した内容をまとめたソースコードを以下の記載します。

from urllib import request
from lxml import html
source = request.urlopen("https://example.com")
data = source.read()
print(data.decode())
print("n---------------------------------------n")
load_html = html.fromstring(str(data))
h1_content = load_html.xpath("//h1")
# タグの中身を取得
for content in h1_content:
    print(content.text)

実行するとHTMLのソースとh1タグで抽出した内容が出力されます。

まとめ

今回はXPathの使い方を簡単なスクレイピングを交えて紹介しました。

この方法を使えばWebスクレイピングを簡単にできます。しかし、実際のサイトはもっと構造が複雑になってくるため、この方法でデータを抽出できなかったりデータに文字化けが出てきたりするので、本格的にスクレイピングをやりたい方は、XPathの他にも文字列操作やエラー処理などを適切に行なっていきましょう。

コラム

コスパとタイパ、両方結果的に良くなる良くなる学び方とは？

「スクールは高いし時間も縛られて効率が悪い」と考える方は多いと思います。
もちろん、時間も費用もかかることは間違いありません。
ただ結果的に無駄な学びにお金も時間もかける方がリスクが高いという考えもあります。

コスパ・タイパ最適化の参考として、テックアカデミー卒業生がスクールを選んだ理由をご紹介します。

・困ったときに、質問や相談できる相手がいるため挫折しなかった
・プロとして必要なスキルのみを深く学べたので無駄がなかった
・副業案件の提供と納品までのサポートがあったので目的を達成できた

安価・短期間で広く浅く学んでも意味がありません。本当に自分の目的が達成できるか、それが重要です。
自分にどのスキルや学び方が合っているか、どんな学習方法かなど、お気軽に無料相談に参加してみませんか？

カウンセラー・現役のプロへ、何でも気軽に無料相談可能。 30分か60分お好きな時間が選べて、かつ3回まですべて無料でご利用できます。
無理な勧誘は一切ないので、お気軽にご参加ください。

今なら相談した方限定の割引・参加特典付き！無料相談はこちら

監修してくれたメンター

メンター三浦

モバイルゲームを運用している会社のエンジニアをしています。趣味でWEB開発やクラウドコンピューティングもやっており、ソフトもハードもなんでもやります。

TechAcademyジュニアではPythonロボティクスコースを担当しています。好きな言語はPython, Node.js。

内容分かりやすくて良かったです！

ゆかりちゃんも分からないことがあったら質問してね！

分かりました。ありがとうございます！

TechAcademyでは、初心者でも、Pythonを使った人工知能（AI）や機械学習の基礎を習得できる、オンラインブートキャンプを開催しています。

また、現役エンジニアから学べる無料体験も実施しているので、ぜひ参加してみてください。

プログラミングを独学で学習していて、このように感じた経験はないでしょうか？

・調べてもほしい情報が見つからない
・独学のスキルが実際の業務で通用するのか不安
・目標への学習プランがわからず、迷子になりそう

テックアカデミーでは、このような学習に不安を抱えている方へ、マンツーマンで相談できる機会を無料で提供しています。
30分間、オンラインでどんなことでも質問し放題です。

「受けてよかった」と感じていただけるようカウンセラーやエンジニア・デザイナーがあなたの相談に真摯に向き合います。

「自分に合っているか診断してほしい」
「漠然としているが話を聞いてみたい」
こんなささいな悩みでも大丈夫です。

無理な勧誘は一切ありませんので、まずはお気軽にご参加ください。
※体験用のカリキュラムも無料で配布いたします。（1週間限定）

今なら参加者限定の割引特典付き！無料相談を予約する

Kiteを利用してPythonでの開発を効率化する方法を現役エンジニアが解説【初心者向け】

Kiteを利用してPythonでの開発を効率化する方法について、TechAcademyのメンター（現役エンジニア）が実際のコードを使用して、初心者向けに解説しま...

Python

Pythonのdict型オブジェクトを初期化する方法を現役エンジニアが解説【初心者向け】

Pythonのdict型オブジェクトを初期化する方法について、テックアカデミーのメンター（現役エンジニア）が実際のコードを使用して初心者向けに解説します。 ...

Python

Pythonの特殊変数allについて現役エンジニアが解説【初心者向け】

Pythonの特殊変数__all__について、TechAcademyのメンター（現役エンジニア）が実際のコードを使用して、初心者向けに解説します。 Pyt...

Python

Pythonで四捨五入、切り捨て、切り上げを行う方法を現役エンジニアが解説【初心者向け】

Pythonで四捨五入、切り捨て、切り上げを行う方法について解説します。そもそもPythonについてよく分からないという方は、Pythonとは何なのか解...

Python

Pythonのxrange関数について現役エンジニアが解説【初心者向け】

Pythonのxrange関数について、TechAcademyのメンター（現役エンジニア）が実際のコードを使用して、初心者向けに解説します。 ...

Python

WindowsOSでのPythonにおけるmecabの利用方法を現役エンジニアが解説【初心者向け】

WindowsOSでのPythonにおけるmecabの利用方法について、TechAcademyのメンター（現役エンジニア）が実際のコードを使用して、初心者向けに...

Python

あわせてよく読まれている記事

RubyでXPathを取得する方法を現役エンジニアが解説【初心者向け】

RubyでXPathを取得する方法について解説します。そもそもRubyについてよく分からないという方は、Rubyとは何なのか解説した記事を読むとさらに理解が深まります。なお本記事は、TechAcademyのオンラインブートキャンプRuby講座の内容をもとに紹介しています。田島悠介今回は、Rubyに関する内容だね！大石ゆかりどういう内容でしょうか？田島悠介 XPathを取得する方法について詳しく説明していくね！大石ゆかりお願いします！ XPathとは XpathとはXML文章の中の要素や属性値を指定することができるようにする言語です。HTMLもXpathを使ってHTML文章の中の要素を指定することができます。 Xpathはツリー構造から特定の要素や属性値を取得するためにロケーションパスを使います。ロケーションパスとはURLのように/html/body/divとして”/”で区切って指定する方法です。 XPathを取得する方法 nokogoriというスクレイピングできるRubyのライブラリーを使ってXpathを取得してみましょう。 require 'nokogiri' file1 = File.read(ファイル名) file2 = Nokogiri::XML(file1) set = file2.xpath(ロケーションパス) のように読み込まれたファイルに書かれている該当のロケーションパスを取得します。 [PR] Pythonで挫折しない学習方法を動画で公開中実際に書いてみようそれでは実際に書いてみましょう!! # diary.html <html> <head> <title> <h1>日記帳</h1> </title> </head> <body> <div> <h2>日記内容</h2> </div> <h2>投稿日</h2> <div>

Ruby

Laravelでformを使う方法【初心者向け】現役エンジニアが解説

今回は、Laravel のFormを利用してフォームの作成を行っていきます。 LaravelのFormを利用することで、ブラウザ画面からフォームを利用してデータを送信することが可能になります。実務でもWebアプリケーションを開発する際、ユーザーがデータをフォーム入力して、データベースに登録する処理はよく利用しますので、非常に実践的な内容になっています。目次 Formとは Formの例 Laravelとは Laravel の始め方 tinker の使い方 Mysqlの設定 Mysqlの利用 Laravelの処理 Laravel Collectiveの使い方 Formとは WebアプリケーションでFormというと、企業ページへのお問い合わせフォームであったり、SNSの投稿フォームだったり、多岐にわたり多用されます。このFormという単語ですが、初学者の頃は、Fromと混同しやすくタイプミスが発生する点に注意していただくと、学習がスムーズです。今回は、LaravelのライブラリであるLaravel CollectiveというライブラリのFormファサードを利用して実装していきます。 Formファサードとはデザインパターンで言うところの、複数のクラスを利用する上で窓口となるクラスを利用して、依存関係を含めシンプルに処理を実装することができる仕組みです。デザインパターンというのは、プログラミングのアルゴリズムを定型化することで、誰でも高品質な処理を実装することができる考え方です。アルゴリズムというのは、プログラミングの処理の流れです。例えば、子供の頃、迷路の本などで入り口から出口までなぞり書きしたことがあるかと思います。入り口から出口まで後戻りせず、一筆書きで迷路をクリアする処理をアルゴリズムとイメージすると良いかもしれません。クラスとは、あるオブジェクトの設計図です。オブジェクトを作るためには設計図を設計した上で、設計図に基づいてオブジェクトの作成が必要です。オブジェクトとは、クラスという設計図から生成される製品です。家を例にすると、家という製品（オブジェクト）は、柱や壁や電気や水道やガスなどいろいろな部品によって、クラスという設計図に基づいて構成されています。つまり、家の設計図がクラスで、実際の家がオブジェクトというイメージになります。そして、実際の製品をインスタンスと呼びます。これは、生成する家が全く同じクラス（設計図）に基づくオブジェクト（製品）であっても、インスタンス（田中様の家）、インスタンス（鈴木様の家）というように、生成後は別の意味を持った家になるためです。家の設計図であるクラスを利用して、様々な家を集積するようなWebアプリケーションを実装する場合、家というクラスだけでなく、車というクラスや、お店というクラスもあるかもしれません。どの家とどの車が同じ所有者で、その所有者はお店も所有しているのか、お店を利用するだけなのか、というようにクラス同士が連動して動作する場合、最終的なWebアプリケーションがクラスでごちゃごちゃになりかねません。そこで、Formファサードのような依存関係をシンプルに実装してくれる機能を利用していくと、実務でも保守のしやすい素敵なアプリケーションを実装可能になります。 [PR] Pythonで挫折しない学習方法を動画で公開中Formの例今回は次のようなFormタグを利用します。 Form::model Form::modelで、モデルデータと連動しながらForm処理を開始します。そうでない場合は、Form::openを利用することができます。 Form::label Form::labelで、ラベルの生成処理をします。 Form::text Form::textで、テキストボックスの生成処理をします。 Form::submit Form::submitで、送信表示の生成処理をします。 Form::close Form::closeで、Formタグの実装を終了します。今回利用するFormタグ以外にも、たくさんのFormタグが存在するので、Laravel Collectiveの公式ページを参考にしていただくと良いですよ。 LaravelCollective | HTML v6.x Laravelとは Laravelとは、PHPでWebアプリケーションを開発する際、セキュリティも高く、効率的な開発をすることができるフレームワークです。フレームワークとは、Web開発における共通処理であるライブラリを呼び出すことで、効率的にWebアプリケーションを開発することができるツールです。ライブラリとは、よく利用する便利な処理をまとめて実装しているプログラムです。同じような処理をしているライブラリが、世界中に存在するため、どのライブラリを呼び出し利用するかはプログラマーが考えて決定します。コラムコスパとタイパ、両方結果的に良くなる良くなる学び方とは？「スクールは高いし時間も縛られて効率が悪い」と考える方は多いと思います。もちろん、時間も費用もかかることは間違いありません。ただ結果的に無駄な学びにお金も時間もかける方がリスクが高いという考えもあります。コスパ・タイパ最適化の参考として、

PHP

Javaで簡易な掲示板を作成する方法を現役エンジニアが解説【初心者向け】

Javaで簡易な掲示板を作成する方法について解説します。実際にプログラムを書いて説明しているので、ぜひ理解しておきましょう。そもそもJavaについてよく分からないという方は、Javaとは何なのか解説した記事を読むとさらに理解が深まります。なお本記事は、TechAcademyのオンラインブートキャンプJava講座の内容をもとに作成しています。田島悠介今回は、Javaに関する内容だね！大石ゆかりどういう内容でしょうか？田島悠介簡易な掲示板を作成する方法について詳しく説明していくね！大石ゆかりお願いします！掲示板の設計名前とメッセージを入力して投稿する簡易的な掲示板を作成します。掲示板の内容はデータベースに保存し、投稿機能でデータ追加、ページアクセスでデータを全件表示します。作成するものは以下です。データベースデータモデルデータベースアクセスオブジェクト(DAO) 投稿したメッセージの一覧表示と、投稿フォームをもつ画面データベースからデータを全件取得し、取得データを画面へ引き渡すサーブレット画面の入力フォームの内容を元に、データベースに一件データを追加するサーブレット eclipse　Maven MySQL を用いて実装します。またローカルのtomcatへデプロイをして動作確認を行います。実際に作成してみよう eclipseで動的WEBプロジェクトを新規作成してからMavenプロジェクトへ変換します。pom.xmlに以下3つの依存関係を追加します。 <dependencies> <dependency> <groupId>mysql</groupId> <artifactId>mysql-connector-java</artifactId> <version>5.1.45</version> </dependency> <dependency> <groupId>org.apache.taglibs</groupId> <artifactId>taglibs-standard-impl</artifactId> <version>1.2.5</version> </dependency> <dependency> <groupId>javax.servlet.jsp.jstl</groupId> <artifactId>javax.servlet.jsp.jstl-api</artifactId> <version>1.2.1</version> </dependency> </dependencies> データベースとテーブルを作成します。 create database sample default character

Java

最初のステップ！HTMLで覚えておきたい頻出タグ15選【初心者向け】現役エンジニアが紹介

HTMLに慣れる上で欠かせないタグをまとめて紹介しています。どれも頻出のタグで、最低限覚えておきたいものを選んでいるので、これからHTMLを覚えようと思っている方は最初に覚えておきましょう。実際に書きながら進めていくと理解しやすいです。目次 HTMLとは HTMLの基本構造に関するタグサイトコンテンツの作成でよく使うHTMLタグ HTMLとは HTMLは、Hyper Text Markup Languageの頭文字を集めたもので、Webサイトの構造を形成するために使用される言語です。 HTMLではタグと呼ばれるマークアップのための目印を使用し、<●●>(開始タグ)～</●●>(終了タグ)という形を作り、その間に命令を書き実行します。 (終了タグは省略できるものや、書かないものも存在します)ここではサイト作成において必ず使用するタグや、よく使われるタグについて紹介します。 [PR] Pythonで挫折しない学習方法を動画で公開中HTMLの基本構造に関するタグ HTMLの基本的な構造は、以下の通りです。 <!DOCTYPE html> <html lang="en"> <head> <meta charset="utf-8"> <title>ページタイトル</title> <link rel="stylesheet" href="style.css" type="text/css"> </head> <body> <header></header> <main></main> <footer></footer> </body> </html> それでは、ひとつずつ分解して見ていきましょう！ <html> HTML文書であることを示すタグで、(DOCTYPE宣言※のあとの)最初に<html>、最後に</html>と記述します。すべてのHTMLタグは、この<html></html>の中に記述していきます。 ※DOCTYPE宣言は、その文書がHTMLですよということを表すおまじないのようなキーワードです。 <head> 文書全体の基本的な情報、ヘッダ情報を定義します。このタグに記述した内容はページには表示されませんが、ブラウザや検索エンジンがその内容を読み取り、そのWebサイトの状態を判定するため、内容はしっかり吟味する必要があります。 <title> このタグはheadタグ内に記述します。ブラウザのタブで表記される名前、ブックマークされた際に表示される名前になります。 <title>●●通販の△△</title> <meta> このタグはheadタグ内に記述します。 Webサイトのメタ情報を設定するタグです。メタ情報とは、検索エンジンやブラウザに伝える情報全般のことで、様々な種類があります。以下はその中でもよく用いるメタ情報の記述です。  <meta charset="utf-8">  <meta name="description" content="サイトの説明文">  <meta name="viewport" content="width=device-width, initial-scale=1"> <link> このタグはheadタグ内に記述します。指定した文書を参照するタグです。外部スタイルシート（CSS）を適用する場合などはこれを使用します。  <link rel="stylesheet" href="style.css" type="text/css"> <body> Webサイトに実際に表示されるコンテンツすべてを囲むタグです。 <header> HTML5※から追加されたタグで、ヘッダー(Webサイトの先頭)部分に使用します(ヘッダー情報を扱う<head>タグとは別のものです)。主にサイトのタイトルや、ナビゲーション（ヘッダーメニュー）などが入ります。 ※HTML5とは？ HTML5はHTMLの仕様のひとつで、2014年に有効化しました。それまでのHTML4と比べて全体的に機能が拡充されており、よりリッチなWebサイトの開発がしやすい仕組みになっています。本記事執筆時点（2021年）では、HTMLといえばこのHTML5のことを指すことが多くなっています。 <footer> HTML5から追加されたタグで、フッター(Webサイトの一番下)部分に使用します。サイトに関する情報、著作権に関する注記、連絡先などが入ります。サイトコンテンツの作成でよく使うHTMLタグ次は、bodyタグの中でコンテンツの作成に使用する頻出タグの紹介です。 <p> 文章を作成する際に最もよく使うタグです。正確には「段落（paragraph）」を表しており、別々のpタグで囲んだ文章は別の段落とみなされます。例えば以下の場合、2つの<p>～</p>によって2つの段落に分けられています。 <p>この文は段落その1です。</p> <p>この文は段落その2です。</p> <h1～h6> 各見出しを設定する際に使用します。 h1タグの内容がそのページで最も重要なキーワードとみなされ、ついでh2, h3と重要度が続きます。文字の大きさだけを表すタグではなく、検索エンジンにより正しい情報を伝えるためのタグなので、内容には常に注意しましょう。 <h1>h1の見出し</h1> <h2>h2の見出し</h2> <h3>h3の見出し</h3> <h4>h4の見出し</h4> <h5>h5の見出し</h5> <h6>h6の見出し</h6> <img> 画像を貼り付ける際に使用するタグです。配置や大きさの設定はCSSで行うことができます。 <img src="img_1.png"> <a> 他のページへのリンクを貼ったり、指定したメールアドレスへの送信を行う際に使用します。開始タグでリンクしたい内容を属性で指定し、タグ内にはリンクを貼りたいテキストや画像を入れます。 <a href="https://example.com/">リンク</a> リンクを別のブラウザタブで開きたい場合、以下のようにtarget=”_blank”という属性を追加します。 <a href="https://example.com/" target="_blank">リンク</a> <ol>・<ul>・<li> リストを作成する際に使用する3種類のタグです。 olとliのセット、もしくはulとliのセットで用います。 <ol> リストを作成するタグです。 ordered listの略で、「1,2,3～」「a,b,c～」といった順番のあるリストを作成します。 <ol> <li>項目1</li> <li>項目2</li> <li>項目3</li> </ol> <ul> unordered listの略で、順番がないリストを作成します。 <li> list itemの略で<ol>〜</ol>あるいは<ul>〜</ul>内に記述します。それらのリストの各項目を作成するときに使用します。コード例は、上記olタグとulタグのサンプルコードを参照してください。 <table>・<tr>・<td>・<th> テーブル(表)を作成する際に使用されます。 <table> 表の開始を示すタグです。内部に<tr>・<td>・<th>が入ります。デフォルトでは枠線は表示されず、border属性に”1″を指定することで表示されるようになります。色や大きさなどの設定はCSSで行います。 <tr> table rowの略で、テーブルの行に使用します。このタグを使用した分だけ行が追加されます。画像では全部で3つの行が作成されています。 <td> table dataの略で、テーブルのセルに使用します。画像内の「内容」の部分にあたります。 <th> table

HTML

HTMLでlinkタグとscriptタグを使ってファイルを読み込む方法【初心者向け】

HTMLについて今さら聞けない！という初心者のために、HTMLの基礎を紹介する記事です。今回は、linkタグとscriptタグを使ってファイルを読み込む方法について解説します。 linkタグとscriptタグは、リッチなサイトを作りたいときに必要になるタグなので、ぜひ参考にしてください。目次 linkタグとscriptタグ linkタグの使い方 scriptタグ【動画での解説はこちら！】田島悠介今回は、HTMLに関する内容だね！大石ゆかりどういう内容でしょうか？田島悠介 linkタグとscriptタグを使ってファイルを読み込む方法について詳しく説明していくね！大石ゆかりお願いします！ linkタグとscriptタグ Webサイトは、htmlとcssで書かれた多くのページによって構成されています。また、より動きのあるサイトを作るには、それに加えてJavaScriptというプログラミング言語を使ってページを作ります。一つのプログラムファイルにhtml・css・JavaScriptを記述するのは不可能ではありません。しかし、プログラムファイルのコードが長くなり、どこに何が書かれているかがわかりづらくなってしまいます。つまり、プログラムファイルに対するコードの可読性が失われるため、一つのプログラムファイルに記述するのはおすすめできません。さらに、htmlはページの文書構造をつくり、cssはページを装飾し、JavaScriptはページに動きを付け加えるといったそれぞれの異なる役割を持ちます。多くのページでサイトが構成される場合、htmlとcssを分割すれば、cssの特定箇所を修正するだけでサイトページを変更できます。例）サイトのイメージカラーを変えたとき、CSSのカラーを一括すると、サイトの全ページのイメージカラーを変更できるこうした理由からWeb製作の現場では、html・css・JavaScriptのファイルはそれぞれ別ファイルに分けて作ることが一般的です。その別々に編集したファイルを紐付けて、一つのページとしてまとめるためにlinkタグとscriptタグがあります。 linkタグ linkタグは、他のファイルをリンクしてhtmlファイルに読み込ませます。 rel属性（relationの略）でそのファイルがどんな文書であるかを指定します。（※スタイルシート(stylesheet)やファビコン(favicon)など） scriptタグ scriptタグは、JavaScriptを読み込むときに使います。 [PR] Pythonで挫折しない学習方法を動画で公開中linkタグの使い方ここからは具体的な使い方について例をみていきます。まず、htmlファイルとcssファイルの2種類を用意します。 htmlファイルには<body>の部分に<h1>タグで「linkタグの使い方を学ぼう」と入力してみます。 cssのファイルには下記のように記述してみましょう。 ※「font-size: 60px;」は<h1>で書かれた文字のサイズが60px、「color: red;」は<h1>で書かれた文字色が赤という意味です。 h1 { font-size: 60px; color: red; } htmlファイルをブラウザで読み込んでみると、<h1>で囲んだ文字が表示されました。 htmlファイルとcssファイルが繋がっていないため、この状態ではまだcssファイルで指定した文字の大きさや色は適用されません。そこでlinkタグを使って、cssで書いた内容をhtmlファイルに繋げましょう。 rel属性でリンクタイプを指定し、type属性によってどのようなテキストであるか、またhref属性でリンク先のURLを指定します。 linkタグは<head>タグ内に記述しましょう。 <link rel="stylesheet" type="text/css" href="style.css"> すると、<link>タグで指定したファイル（”style.css”）が読み込まれ、文字の大きさと色が変わりました！続いて、ファビコンの例も見てみましょう。ファビコンとはブックマーク登録やタブに表示されるときに出てくるアイコンです。実際のWebサイトでは下のように設定されています。スタイルシートやファビコンを別ファイルから読み込む際にはlinkタグを使うということを覚えておきましょう。大石ゆかり CSSは外部ファイルとして読み込んだほうがいいんですか？田島悠介たくさんのページで共通して使う場合は、もちろんHTMLと分けたほうがソースコードも見やすくなるからね。大石ゆかりタグに直接CSSを適用したら、どちらが優先されるんでしたっけ？田島悠介タグに直接適用したCSSの方が優先されるよ。大石ゆかり OK！linkタグ覚えました！ scriptタグ続いてscriptタグです。 Webページには2種類のページがあります。１つ目は、html・cssだけで書かれた文書のようなページ（静的なページといいます）です。 2つ目は、ドロップダウンメニューやスライドショーなどといったユーザーがアクションを起こすと、それに伴って何か変化が起こる動的なページです。動的なページには、JavaScriptなどのプログラム言語が使われており、演算機能やループ処理など様々な機能が利用できます。このJavaScriptを記述する際に利用するタグが、scriptタグです。 scriptタグを使ってhtmlファイル内にJavaScriptを書いてみましょう。 <script type="text/javascript">（JavaScriptのコード）</script> ここでは、JavaScriptで「『JavaScriptでループ処理』という文を1から100までループさせる」というコードを書いてみます。 <script type=”text/javascript”>と</script>の間に書かれている「var i;」から「<BR>”);」までの部分がJavaScriptです。 JavaScriptのループ処理がわからない場合は、JavaScriptでfor文を使ってループ処理する方法をご覧ください。このhtmlファイルを読み込むと、ブラウザ上で<script>タグ内で書いた処理が実行されました。今度は、別ファイルで記述したJavaScriptを<script>タグでリンクさせて、htmlファイルに読み込ませてみましょう。 htmlのファイルとjavascriptのファイルを2つ用意して、実行したいJavaScriptのコードをjavascriptのファイルに記述します。（保存する際には「.js」という拡張子を使いましょう） type属性によってどのような種類のテキストなのかを指定し、src属性によって外部ファイル（ここでは”javascript.js”）を読み込みます。「.js」という拡張子の付いたファイルにコードを書く場合は、開始タグと終了タグの間には何も記述しません。 <script type="text/javascript" src="javascript.js"></script> htmlファイルをブラウザ上で表示させると、src属性で指定した”javascript.js”が読み込まれ、先ほどと同じようにJavaScriptの処理が実行されました。このように別々のファイルで書かれた内容も、<link>タグや<script>タグを使ってファイル同士を自在に紐付けることができます。 <link>タグも<script>タグも属性を付け加えることで、紐付けたいファイルの種類や場所はどこなのかといった情報を指定します。外部ファイルを組み込んでリッチなサイトを作りたいときに必要になってきますので、ぜひ覚えておきましょう。今回はlinkタグとscriptタグを使ってファイルを読み込む方法についてご紹介しました。 HTMLの基礎をさらに学びたい場合は、HTMLでラジオボタンとチェックボックスを表示する方法み合わせてご覧ください。コラムコスパとタイパ、両方結果的に良くなる良くなる学び方とは？「スクールは高いし時間も縛られて効率が悪い」と考える方は多いと思います。もちろん、時間も費用もかかることは間違いありません。ただ結果的に無駄な学びにお金も時間もかける方がリスクが高いという考えもあります。

HTML

Pythonでセレニウムをサイト上で活用する方法を現役エンジニアが解説【初心者向け】

Pythonでセレニウム(Selenium)を使用してWebサイトのボタンをクリックする方法について、TechAcademyのメンター（現役エンジニア）が実際のコードを使用して、初心者向けに解説します。 Pythonについてそもそもよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が深まるでしょう。なお本記事は、TechAcademyのオンラインブートキャンプ、Python講座の内容をもとに紹介しています。田島悠介今回は、Pythonに関する内容だね！大石ゆかりどういう内容でしょうか？田島悠介 PythonでSeleniumを利用してWebサイトのボタンをクリックする方法について詳しく説明していくね！大石ゆかりお願いします！ Seleniumとは Selenium(セレニウム)とは、webアプリケーションなどを含め、ブラウザを自動で操作することができるオートメーションツールです。 Seleniumを使用することでブラウザ上での様々な操作を自動化することができるでしょう。 Webサイトのボタンをクリックする方法今回はGoogle chrome上でのボタンクリック処理の実装方法についてみていきましょう。まずはChromeのインストールが完了し、Seleniumのインストールを行います。 Seleniumはpipを使用してインストール可能です。ターミナル上に下記コマンドを入力してインストールを行いましょう。 pip install selenium 次にchromeのウェブドライバをダウンロードしてください。ダウンロード後、Webサイトのボタンをクリックする方法をみていきましょう。 SeleniumでWebサイトのボタンをクリックするためには、大きく2つの処理が必要になります。クリックしたいボタンの要素を取得する。取得した要素(ボタン)をクリックする。では、詳しくみていきましょう。 1.クリックしたいボタンの取得方法要素を取得するには、以下のように記述してください。 driver.find_element_by_xpath('取得したい要素のxpath') Seleniumではxpath以外にも様々な方法で要素の取得が可能です。 2.取得した要素をクリックする取得した要素をクリックするには、以下ように記述してみましょう。 .click() そして、以上の2つの文法を組み合わせて以下のように1行で記述することも可能です。 driver.find_element_by_xpath('取得したい要素のxpath').click() まだseleniumの操作に慣れていない場合は、エラーが発生した場合に原因の特定がすぐできるように以下のような複数行に分けての記述してみましょう。 element = driver.find_element_by_xpath('取得したい要素のxpath') element.click() [PR] Pythonで挫折しない学習方法を動画で公開中実際に書いてみようサンプルコード # coding:utf-8 import time from selenium import webdriver # ブラウザを開く。 driver = webdriver.Chrome(executable_path='ウェブドライバを設置したフルパス') # Yahoo!JAPANのTOP画面を開く driver.get('https://www.yahoo.co.jp/') # 5秒待ちます time.sleep(5) # TOP画面の検索ボタンの要素を取得する element = driver.find_element_by_xpath('//*[@id="ContentWrapper"]/header/section[1]/div/form/fieldset/span/button') # 取得した要素(検索ボタン)をクリックする element.click() 実行結果コードを実行するとブラウザが起動し、Yahoo!JAPANのトップページが表示されるでしょう。トップページが表示された５秒後に自動的に検索ボタンがクリックされ、検索画面が表示されるでしょう。解説コード6行目では、seleniumを使用するためのWebドライバーを設定しています。事前にダウンロードしたchromeのWebドライバーを保存しているパスを入力しましょう。コード9行目では、設定したWebドライバーを使用してYahoo!JAPANのトップページを開いています。コード15行目では、検索ボタンの要素をelementに指定している状態です。コード19行目では、検索ボタンの要素を指定したelementをクリックしています。実行結果では、Yahoo!JAPANのトップページが5秒間表示された後に検索画面のページに自動で移行する動作が確認できるでしょう。まとめ今回は、 PythonでSeleniumを利用してWebサイトのボタンをクリックする方法について解説しました。 Seleniumに関しては、他にも様々な操作をサポートしているため、この際に学習してみましょう。コラムコスパとタイパ、両方結果的に良くなる良くなる学び方とは？「スクールは高いし時間も縛られて効率が悪い」と考える方は多いと思います。もちろん、時間も費用もかかることは間違いありません。ただ結果的に無駄な学びにお金も時間もかける方がリスクが高いという考えもあります。

Python

記事を検索

ニュース

インタビュー

テクノロジー

キャリア

お問い合わせ

PythonでXPathを利用しXML形式の文書から特定の要素を抽出する方法を現役エンジニアが解説【初心者向け】

XPathとは

lxmlのxpath関数の使い方

実際に書いてみよう

まとめ

監修してくれたメンター

関連するキーワード

あわせてよく読まれている記事

RubyでXPathを取得する方法を現役エンジニアが解説【初心者向け】

Laravelでformを使う方法【初心者向け】現役エンジニアが解説

Javaで簡易な掲示板を作成する方法を現役エンジニアが解説【初心者向け】

最初のステップ！HTMLで覚えておきたい頻出タグ15選【初心者向け】現役エンジニアが紹介

HTMLでlinkタグとscriptタグを使ってファイルを読み込む方法【初心者向け】

Pythonでセレニウムをサイト上で活用する方法を現役エンジニアが解説【初心者向け】

TechAcademyから
現役エンジニアの方へ
お知らせ

記事を検索

ニュース

インタビュー

テクノロジー

キャリア

お問い合わせ

XPathとは

lxmlのxpath関数の使い方

実際に書いてみよう

まとめ

監修してくれたメンター

記事を検索

関連するキーワード

関連する記事

あわせてよく読まれている記事

TechAcademyから 現役エンジニアの方へ お知らせ

TechAcademyから
現役エンジニアの方へ
お知らせ