練習帳#
このノートブックでは、1-8章で抑えておくべき基本事項を確認するための練習問題を与える。
この練習帳の目的は、皆さんが自分自身の理解・疑問点を確認するためであって、練習帳で書いているコードや記述が正しいかどうかは一切授業の評点には関係がない。
一方で、練習帳の記載内容が明らかな盗用・剽窃であると判断された場合、事実確認の上、厳正な措置を取ることがあるので注意されたい。
したがって友人に見せてもらったり相談をして体裁を整える必要はまったく無い。
質問やその返答を円滑にするための連絡帳のようなものだと思ってもらえれば良い。
とにかく、自分の理解を確認するためにコードをどんどん書いてどんどん失敗しよう。
また、教員に対する質問の見落としを防ぐため、リアクションシート(C-Learning)上で
練習帳に詳細な質問とコードを書きました
などと教えてもらえるとスムーズな対応が可能になります。
リアクションシートの提出やその他、連絡・相談などでの質問の際は、必ず毎回練習帳の共有リンクを添えてください
慣れないうちは、エラーの原因がわからない場合はとにかく教員に聞く。 その際は、エラーメッセージを転記したりスクリーンショットを添えて質問しよう。
慣れてくると、自分でエラーメッセージをWebで検索したり、よくあるエラー集などを見て、原因の特定・解決ができるようになる。
練習帳のノートブックの共有の仕方#
以下の手順にならってください(1-3は1度やれば再び行う必要はありません)。
まずノートブックのコピーを作成し、ファイル名を適当に編集する: 例: 練習帳_氏名_123456X.ipynb (123456Xは学籍番号のつもり)
右上の共有ボタンを押し、「制限付き」を「リンクを知っている全員」に変更 (共有ボタンが見えない場合、編集権限がないつまり「ノートブックのコピーをつくる」というお約束を忘れていることを意味する)
「リンクを知っている全員」の右にある「閲覧者」を「編集者」に変更する
最後に、「リンクをコピー」をクリックし、そのURLをブックマークするか、どこか(メモ帳やメールの下書きなど)に保存しておこう.
2回目以降はC-Learningで一度提出した過去のURLをコピーするのが手っ取り早い. ※ここでの注意は、「リンクをコピー」を押して得られたURLを貼り付けること。自身が開いているノートブックのアドレスバーのURLをコピーするのではない。
元の問題文さえ残っていれば、練習帳のレイアウトは好きに改変してOK. コードセル・テキストセルともに自由に追加して構わない。
なお、markdown形式の記述方法が知りたい方は、WikipediaのMarkdownのページなどを適宜参照すること。
第1章:Pythonの基礎#
練習問題:
身長と体重に相当する変数を適当に定義し、BMI(体重kg ÷ 身長mの二乗)を計算した上で
print
関数で表示せよ (自身の身長体重を用いる必要はない)上で計算したBMIに対応する変数と
str
関数を用いて文字列を連結し、”AさんのBMIは22.0です”などと表示させよ。
もし、小数点以下第2位まで表示したいなど、表示を工夫したい場合は下のヒントを参考にためしてみよう。
# 問題1.&2.に対応するコードを以下に記載してください
# 問題2.に関するフォーマット指定の例 (ややテクニカルなので、理解できなくても問題ありません)
value = 3.141592653589793
# 例1: 小数点以下4桁まで表示し、全体の幅を9にする
print("例1", str("%9.4f" % value)) #
# 例2: 指数表記で表示 (小数点以下2桁まで表示し、全体の幅を7にする)
print("例2", str("%7.2e" % value))
# 例3: 小数点以下2桁まで表示
print("例3", f'{value:.2f}')
# 例4: 小数点以下4桁まで表示し、全体の幅を9にする(1の別の書き方)
print("例4", "{:9.4f}".format(value)) # 小数点以下4桁までfloat型で表示し、全体の幅を9にする
例1 3.1416
例2 3.14e+00
例3 3.14
例4 3.1416
1章の振り返り
これらの点をチェックし、必要ならコードセルを追加して練習しよう:
変数の定義や四則演算の方法が分かる
print
やstr
などの基本的な関数の使い方がわかるプログラムの実行順序と、セルを跨いで実行する際の注意点がわかる
基本的な変数の型とその調べ方が分かる
第2章:Pythonの基礎2#
練習問題:
要素に身長(単位:cm)と体重(単位:kg)を持つ適当なリストを定義し、5人のデータ(リスト)を要素にもつ入れ子構造のリストを作成せよ。
ただし3人目の身長と体重は必ず175,60とすること(それ以外は適当で構わない)。for
文を使って、上で作成した5人分のデータ(入れ子構造のリストの各要素)を表示せよ.上のリストから、5人の平均身長と平均体重をそれぞれ計算するコードを作成せよ。
算術平均を取る際は、数字の5などを使うのではなく、リストの長さを使うなどして、
リストの要素の数が5個以外(10や100)でも正しく計算できる汎用性のあるコードにすること。上のリストについて、
for
文を用いて全員のBMI(体重kg ÷ 身長mの二乗)を計算し、一人ずつBMIを表示させよ。(身長の単位に注意)for
文のブロック内でif
とbreak
を用いて、「BMIが20.0以下なら、値を表示したあとにループを終了する」という処理を実現せよ。
# コードを以下に記載してください
ヒント&助言:
list
という変数名のリストを作らない!list
はリストと互換性のあるオブジェクトをリストに変換するための関数です。list = [1, 2]
などと一度実行してしまうと、以降でリスト関数が使えなくなります。 予約語やprint,listなどの組み込み関数を変数として上書きしてしまうと、元の機能が使えなくなり、不都合が生じる場合があります。
print = "Hey!" print("Hello")
などとすると、
'str' object is not callable
既に文字列(str)型になっているprintを関数みたく使う(callする)ことはできないよ!とエラーが発生し、print関数を使えなくなってしまいます。
そうしたときは、変数名を適切に変更した上で、【ランタイム】→【ランタイムの再起動】を行えば、元の予約語や組み込み関数を問題なく使えるようになります。ブロックに注意!
インデントによる処理のブロックの指定に注意が必要です。 例えばfor文を条件文(if)に応じてbreakする場合は、for文のブロックの中にif文のブロックを書く必要があります。
2章の振り返り
とくに2章は重要な概念が盛りだくさんなので、必ず練習したり、疑問があれば質問すること!
これらの点をチェックし、必要ならコードセルを追加して練習しよう:
リストの定義や要素へのアクセスの方法(インデックスやスライス)が分かる
リストに要素を加える方法が分かる
if
文による条件分岐が分かるfor
やwhile
によるループ処理がわかる
第3章:関数#
練習問題:
摂氏温度(℃,度)に対応する数値を受けとり、絶対温度(K,ケルビン)を返す関数をコードセルに書いておいた。 この関数を用いて、摂氏0度,20.55度,42.199度に対応する絶対温度をそれぞれ計算し、print文で表示せよ。
要素に実数値を持つ適当なリストを2つ以上定義し、任意の長さの実数値のリストについて平均と分散を返り値とする自作関数を作成せよ。 なお、分散の定義は下記の標本分散とする:
\[ \frac{1}{N}\sum^N_{i=1} (x_i - \bar{x})^2 \]ここで\(N\)はデータの個数、\(x_i\)が各データ、\(\bar{x}\)は平均を意味する。
平均を計算する関数、分散を計算する関数をそれぞれ作成しても良いし、一つの関数でまとめても良い。ポイントは任意の長さのという点で、リストの長さが2とか3とか、特定の場合にしか対応していないコードを書くのではなく、リストの長さに依存しない汎用的なコードを書くこと。
2.で作った自作関数の返り値の型を
type
関数で調べて表示せよ。
# コードを以下に記載してください
#1.
def K_from_C(C):
K = C + 273.15
return K
3章の振り返り
これらの点をチェックし、必要ならコードセルを追加して練習しよう:
自作関数の定義の仕方・呼び出し方が分かる
引数(インプット)や返り値(アウトプット)の扱い方が分かる
第4章:ライブラリ/パッケージ/モジュールとデータの可視化#
練習問題:
授業で扱った
math
,numpy
の何れかを使って、任意の半径r
について円の面積と球の体積を計算する自作関数を作成せよ。matplotlib
を用いて、好きな図を作成させノートブック上に表示させよ。その際、matplotlib
(とくにmatplotlib.pyplot
)の使い方を調べて色をカラーコードで指定する
グラフを構成するオブジェクトの透過度を設定する
など、授業で指定していないオプションを試してみよう。
math
モジュールの公式Documentを参照し、
授業で扱っていない関数を1つ選び、その関数を使ったコードとその説明を記載すること。
# コードを以下に記載してください
4章の振り返り
これらの点をチェックし、必要ならコードセルを追加して練習しよう:
ライブラリのインストールやインポートの仕方が分かる
matplotlibの簡単な使い方が分かる
Webの情報や公式ドキュメントを読んだりして、使い方を調べることができる
第5章:確率と擬似乱数#
練習問題:
0からn-1(nは適当な整数)までのn個の整数から、重複なくランダムにn個選ぶ(つまり0からn-1の無作為な並べかえをする)コードを作成せよ。(
numpy.random.choice
を使うとよい)1.を用いて、任意の文字列のリスト(例: 名前のリスト
["Aさん","Bさん",...]
)をランダムに並び替えて出力するコードを作成せよ。
# コードを以下に記載してください
# 2.のヒント (AさんからZさんまで作っておきます)
# 解説: Pythonの組み込み関数の`chr`には、Unicodeのコードポイントと呼ばれる整数値から、対応する文字列を返す機能があります。
# 例えばchr(65)は'A'に、chr(66)は'B'に、... chr(90)は'Z'になります。
names = [ str(chr(i)) for i in range(65, 91) ]
5章の振り返り
これらの点をチェックし、必要ならコードセルを追加して練習しよう:
random
やnumpy.random
モジュールを用いて、簡単な確率的事象を表現する方法がわかる適当な区間内でランダムな整数を生成することができる
適当な実数の乱数(一様乱数・正規乱数)を生成することができる
おまけ: Unicodeについて
chr
の反対に、文字からUnicodeのコードポイントを返す関数ord
がある。
print( ord("吉"), ord("田"))
これを活用すると、 下記のように簡単な暗号化・復号化を行うこともできる。※大した暗号になっていないので、実際に使って叱られたりしないように。
code = [ ord("吉"), ord("田"), ord("の"), ord("話"), ord("は"), ord("面"), ord("白"), ord("く"), ord("な"), ord("い")]
print("暗号化=>", code)
print("複号化=>", "".join([ chr(i) for i in code ]))
第6章:相関・回帰分析#
練習問題:
以下のデータ
x
(宇都宮市の月別平均気温)とy
(アイスクリーム・シャーベットの消費量)のうち、
8月のデータ(気温か消費量のいずれか)をランダムな値に変更し相関係数がどうなるか5通りほどで示せ。
なお、値を変更する際はインデックスやリストの対応する値を直接書き換えるのではなく、
ランダムな値をインデックスに使うことで、値を変更するコードを書くこと。
(なぜなら、データが大量の場合、手でインデックスや、対応するリストの値を書き換えるのは現実的ではないから)疑似相関について調べ例をあげよ。(できれば自身の興味に近いものや日本の事例などを調べてみること)
# コードを以下に記載(追記)してください
x= [3.1, 4.3, 6.6, 13.2, 19.1, 20.9, 26.4, 25.1, 21.9, 15.7, 9.6, 3.8]
y= [568, 572, 804, 833, 930, 965, 1213, 1120, 835, 540, 451, 502]
6章の振り返り
これらの点をチェックし、必要ならコードセルを追加して練習しよう:
相関分析の意味を、友人等に説明できる
長さの等しい2つのリストについて、相関係数を計算することができる
簡単な場合について自作関数とライブラリの出力が同じであることを確認することができる
第7章:最適化問題#
練習問題:
以下に示したデータ(
x
:年,y
:男子100m走の世界記録(秒))について、6章で出てきたpolyfitを使って1-5次式までの多項式でフィッティングしてみよう。
# コードを以下に記載(追記)してください
y = [ 10.06, 10.03,10.02, 9.95,9.93, 9.92,9.9, 9.86,9.85, 9.84, 9.79, 9.78, 9.77, 9.74,9.72,9.69,9.58 ]
x = [1964, 1968,1968,1968,1983,1988,1991,1991,1994,1996,1999,2002,2005,2007,2008,2008,2009 ]
7章の振り返り
これらの点をチェックし、必要ならコードセルを追加して練習しよう:
多項式回帰の意味を、友人等に説明できる
ライブラリを用いて多項式回帰(係数の最適化)を行うことができる
係数の最適化の結果から、グラフの描画点を生成し、可視化することができる
第8章:ファイル操作#
練習問題:
コードセルに示したように、
Pandas
を用いてWeb上にあるcsvファイルを読み込んでみよう。例として、栃木県のオープンデータ「ベリーとちぎ」から保育所一覧(2021年4月1日現在)を利用する。
なお、このcsvファイルはShift-JISでエンコードされているため、
encoding
オプションを指定する必要がある。
また、適宜URLを別のcsvファイルに変更しても構わないが、その場合はURLのほか、簡単な説明やコメントを添えること。Google Driveをマウントし、1.で読み込んだデータをGoogle Driveに保存せよ。
この問題はDriveのマウント・パスの指定などの一連の作業が理解できているかを確認するものなので、エラーが出た場合はそのログや自身が試した工程について、
スクリーンショットなども活用しながらできるだけ詳細に報告すること。特に問題なく作業ができた場合は、2の図を送るなどはしなくて構わない。また、プライベートなGoogleアカウントを使用している(※授業では非推奨)場合、相談の際にはプログラムの出力結果やスクリーンショットなどに他人に見られて困るものが映っていないか配慮すること。
余力があれば、Pythonで地図上にデータをプロットする方法を調べてみよう。代表的なライブラリとしては
folium
やgeopandas
などがある。こちらは、地図上にプロットしたりできると楽しいよ、というだけで、とくにコード欄に記載したりする必要はない。
# コードを以下に記載(追記)してください
#1. (コードは書いておきましたので、挙動を確認してください)
import pandas as pd
url = "https://data.bodik.jp/dataset/47cb5069-7383-47d3-a7df-b84d59484432/resource/37469f20-ed3c-4f9e-a5c4-fa750fc3c673/download/42064_2021_hoikusyo_02184.csv"
df = pd.read_csv(url, encoding="cp932")
#df = pd.read_csv(url) #上の代わりにこの行のようにencodingの指定をなしにするとエラーになることも確認してみよう
display(df)
#2.
# DataFrameにはcsvに変換して保存するためのto_csvメソッドが用意されているので、それを使うと簡単にcsvを作成できる。
# 以下のコードのパスを書き換えて自身のGoogle Driveに保存してみよう。また、encodingオプションで文字コードのエンコーディングを指定することもできる。
df.to_csv('content/drive/MyDrive/your_file.csv')
8章の振り返り
これらの点をチェックし、必要ならコードセルを追加して練習しよう:
Google ColaboratoryでGoogle Driveをマウントすることができる
Google Drive上にあるcsvなどのファイルを読み込むことができる
読み込んだファイルの内容から、必要なデータを取り出してprintしたり、配列を作り、それをグラフとして描いたりすることができる
最終課題#
授業の後半で取り組む最終課題については、自由な発想で課題を設計し、取り組んでもらって構わない。
条件としては、以下のようなものが挙げられる:
1人(ないし2名ペア)で取り組むこと
ペアの場合は、それぞれの寄与が明確かつ十分と認められること、および、ペアでやる必然性を示すこと都度、教員に相談しながら、計画的に進めること
事前に教員に確認すべき課題の例
個人情報(例えば自営業をしている実家のデータを分析するなど)を含む場合は、それをマスクする処理が可能であること
特定のサービス・ソフトウェア・アプリに関する分析(ゲームのデータなどは著作権等の理由から多くの場合不可)
アカウントの作成やライセンス等の購入が必要な外部サービスを使用する課題でないこと(≒教員が特段の手続きを経ずとも、課題作成者のサポートや採点・評価が可能なものであること)
その他、教員が不適切と判断した課題については、課題の変更を求めることがある。
何もないところから課題を設計するのは難しい。以下の例を参考に、計画をたてよう:
公開データを元に、栃木県のデータを可視化・分析したいとする。 その際に必要な工程や、分析を行うために学修すべき事項を列挙しながら、課題を設計していく。
データの収集: 興味のあるデータがオープンデータとして公開されているかを調べる。
例1: e-Stat
例2: オープンデータ・ベリーとちぎ
地図を描き、市町村ごとに特定のデータをカラーマップとして表示する事を考える。
そのためには、市町村の境界線のデータが必要になる。例えば、国土数値情報ダウンロードサービスからデータを収集するとする。
得られたデータを地図上で可視化するために、使えそうなライブラリを探す。例えば、geopandasやfoliumが使えそうである。
簡単なデータから初めて、ライブラリの使い方を学びながら、地図を描くことを目指す。
その他、地図上に関連する(例えば…特定の商業施設やLRTの停留所など)ピンを打ってみる
実際のデータを元に、分析を行う
問題点が生じた場合、その原因を特定し、解決するために必要な知識を学ぶ。(以下試行錯誤…)
といった具合。あくまで、例であるので、自身の興味に合わせて課題を設計していくこと。