ホチキス先生の「プログラマーと呼ばれたい」

InfoPath & SQL Server !

Posts Tagged ‘エクセル

なぜテレビ番組は47%が半分以上に見える円グラフを作ったのか -自分で作ったらこうなった – Microsoft Excel で作る円グラフの秘密

leave a comment »

あるテレビ番組で、世論調査の内閣支持率を円グラフで表したときに、「支持しない」の47%が半分以上になっている円グラフを報道して話題になっている。なぜこのようなことになったのだろうか。

この件は、たとえば次のページで詳細を見ることができる。
@niftyニュース「民放各局の初歩的な放送ミスが相次ぐ 『ひるおび!』の円グラフには呆れの声も」
https://news.nifty.com/article/entame/showbizd/12283-668589/

話題になっているテレビ番組の画面キャプチャはネットのあちこちで見ることができるが、これを見ると確かに「支持する」の33%もやや広いように見え、「支持しない」の47%は明らかに円の半分以上を占めていて間違いは明らかだ。100%から33%と47%をひくと残りは20%だが、この面積もかなり狭い。

試しに作ってみたのが次のグラフだ。このグラフはだいたい話題のテレビ番組の円グラフに近い形だが、これは次のデータをもとに作ったものだ。

支持する 47
支持しない 33
(その他) 1

朝日新聞_円グラフの間違い_20200522_001

ここで想像できるのは、この円グラフを作った人は20%を1%と間違え、合計が100%にならないグラフを作ってしまったということだ。

実際に、この世論調査を実施した新聞社のサイトを見ると、「支持する」と「支持しない」以外は20%あったと書いてある。では正しいデータでグラフを作ってみよう。

朝日新聞_円グラフの間違い_20200522_02

朝日新聞_円グラフの間違い_20200522_002

これが正しいグラフだ。しかし、このグラフを見てどうだろう。確かに「支持しない」を示す赤い部分は円の半分以下ではあるが、一見すると先のグラフより赤い部分が大きく見えないだろうか。

これは円グラフを作るときのテクニックによるものだ。それは「見せたいものを強調する」という手法であり、これを裏返すと情報を受け取る側には「グラフに惑わされないようにする」知恵が必要だということになる。

次のグラフはどうだ。数字は全く同じだが並び順を変えている。

朝日新聞_円グラフの間違い_20200522_003

このグラフだと「支持する」を示す青い部分と「支持しない」を示す赤い部分の差をあまり感じないのではないだろうか。なぜかと言えば「3Dグラフ」だからである。厚みがあるのでデータが手前にくると視覚的に広い面積に受け取ってしまう。

試しにもっと極端に角度をつけてみよう。

朝日新聞_円グラフの間違い_20200522_004

さすがにここまで極端だと「おかしい」と気づくだろうが、本質は同じだ。手前に来るエリアが厚みのために大きく見える。

もうひとつは色が人の心に与える印象の強さだ。色に関する研究で「膨張色」と「収縮色」と呼ばれるものだ。一般に白地を背景にするとき、黄色や赤色は膨張色、青色は収縮色と呼ばれ、膨張色は実際よりも広く、収縮色は実際よりも狭く感じることがわかっている。

では色を変えてみよう。

朝日新聞_円グラフの間違い_20200522_005

人によって感じ方は違うと思われるが、一見すると赤い部分と青い部分は同じくらいの面積か、もしかしたら赤の方が広いと感じるのではないだろうか。ここでは「支持する」が赤色で33%、「支持しない」が青色で47%だ。

次に「支持する」と「支持しない」以外のデータは何かを考える。これはテレビ番組で映し出されたグラフでは何を示しているかわからないが、世論調査を行った新聞社には書かれている。それは「その他・答えない」だ。

「その他」とはどんな回答だろう。おそらく「どちらでもない」や「わからない」といったものではないか。「答えない」はどうだろう。なぜ答えないのか。それは答えたくないからだ。ではなせ答えたくないのか。その世論調査そのものに疑問を感じているからか、調査を実施する新聞社を信用していないことが考えられる。

グラフのデータの並びを変えてみよう。

朝日新聞_円グラフの間違い_20200522_006

「支持する」と「支持しない」という両極端の回答に対して「その他・答えない」を示すとしれば、このように間に挟んで示すべきだろう。

そしてこの「その他・答えない」と答えた人の考え方を類推する。「わからない」と考えている人は、ある意味で誠実な人だ。政治は難しいことがわかっている。内閣がやることを自分のような専門家でない人間が評価するのは難しいと。「どちらでもない」と考えている人は、知性のある人だ。どんなものにも多面性があることがわかっている。内閣のとる政策は山ほどあり、うまくいっているものもあればそうでないものもあるだろう。いずれにせよ、明確に「支持しない」とは考えていないことに間違いない。

「答えない」はどうだろう。これは多くの人にこの世論調査や調査を実施する新聞社がどう認知されているかによるだろう。新聞社は事実を公平に伝えるものだという前提があるが、そもそも情報というものは、それが「情報」として作られるときに例外なく発信者の意図が反映される。客観的な数字でさえそうだ。その数字を情報として示すことに発信者の意図があるからだ。よく株価についてのニュースで「今年最大の株価」と言ったり「今年最大の上げ幅」と言ったりする。また「今月の最高値は今年最大だった」と言うこともあれば「今年は過去20年来の最高値を更新した」と言うこともある。「終値は今年最高の株価」と言うこともあれば「初値は今年最高の株価だった」と言うこともある。客観的な数値などいくらでもあるのだ。もしある日が「今年最大の株価」を更新したとしても、その日のうちの変動が激しく「今年最大の下げ幅」があった日かもしれない。このとき、どちらの数字を情報として示すかは、どのような意図で報道するかによる。

新聞社にも「社風」や会社としての「報道理念」があり、それに基づいて情報を発信する。ではそれが多くの人にどう認知されているかだが、もしこの新聞社が、内閣に対して批判的であると思われていれば「答えない」人は内閣を支持している人だろう。逆に内閣に対して受容的と思われているなら「答えない」人は内閣を支持していない人だろう。

グラフはそのように考えて理解しなければならない。

最後に、この世論調査の実施全体を考えてみよう。調査を行った新聞社によれば、次のような調査だったことがわかる。

調査対象数 2,010 (固定電話978、携帯電話1032)
有効回答数 1,185

朝日新聞_円グラフの間違い_20200522_03

調査対象が2,010で有効回答数が1,185だとすれば、パーセントをかけると実数を類推できる。

支持する 391 (1,185×0.33=391.05)
支持しない 557 (1,185×0.47=556.95)
その他・答えない 237 (1,185×0.20=237)
回答しない 825

つまり調査全体をグラフにすると次のようになるはずだ。

朝日新聞_円グラフの間違い_20200522_007

ここでも回答しなかった人の考えを類推しなければならない。なぜ回答しなかったのか。かけた固定電話の家族に「有権者がいる」または携帯電話の本人が「有権者である」ことはわかっている。なぜ回答しなかったのか。「忙しかった」ことはあるかもしれない。「面倒だ」と思ったかもしれない。それと同時に、前述の「その他・答えない」と同じように、その世論調査そのものに疑問を感じているからか、実施する新聞社を信用していないことも考えられる。

色を変えると、また違った印象に見える。

朝日新聞_円グラフの間違い_20200522_008

次のグラフはやりすぎだ。

朝日新聞_円グラフの間違い_20200522_009

さて最後に、これは検証することは不可能だが、電話をかけたとき、固定電話の973世帯は「有権者がいると判明した」とあるので、実際に電話をかけてから「有権者はいますか」と聞いたと想像される。携帯電話も同じで「有権者につながった」とあるので電話をかけて「有権者ですか」と聞いたはずだ。つまり、電話をかけて相手が出ても「有権者がいない」と答えたり、「世論調査です」と話して新聞社の名前を告げた時点で電話を切られたことがあると思われる。

「有権者はいない」と答えた人の考えを類推しよう。まず本当に有権者がいなかった場合がある。携帯電話なら本人が未成年である場合もあるだろう。単に面倒なので「いない」と答えたかもしれない。そして世論調査に懐疑的であったり新聞社の報道姿勢に疑問があったりして「いない」と答えたかもしれない。何も言わずに電話を切った場合も同じだ。

ここで問題なのは、それら「有権者はいない」と答えたり何も言わずに電話を切った人数が公開されていないことだ。つまり、統計で最も重要な「調査対象総数」とそこなら導き出される「回収率」が不明なことだ。

このように、もともとの調査対象数が公開されなければ、本当の意味で信頼できる世論調査かどうかを判断することはできないと考える。

2020年5月22日
松本 吉生(まつもとよしお)
京都に生まれ、神戸で幼少期を過ごす。大学で応用化学を学んだのち、理科教諭として高等学校に勤務する。教育の情報化が進む中で校内ネットワークの構築運用に従事し、1998年度から2000年度にかけて兵庫県立明石高等学校で文部科学省の「光ファイバー網による学校ネットワーク活用方法研究開発事業」に携わる。兵庫県立西宮香風高等学校では多部制単位制の複雑な教育システムを管理する学籍管理データベースシステムをSQL ServerとInfoPath、AccessなどのOfficeソフトウエアによるOBA開発で構築・運用する。2013年度に「兵庫県優秀教職員表彰」を受賞。2015年から2017年まで兵庫県立神戸工業高等学校でC#プログラミング、IoTなどのコンピュータ教育を行い、現在は兵庫県立神戸甲北高等学校に勤務する。2004年からマイクロソフトMVP(Microsoft Most Valuable Professional)を受賞し、現在16回目の連続受賞。2016年にマイクロソフト認定教育者(Microsoft Innovative Educator Experts : MIEE)を受賞し、現在4回目の連続受賞。2020年1月14日に「令和元年度文部科学大臣優秀教職員表彰」を受賞。

 

Written by Yoshio Matsumoto

2020年5月22日 at 5:10 PM

校務支援システムの更新 – 02 – 既存システムからエクスポートしたデータを加工してはいけない – そのままインポートできるように SQL Server のテーブル設計をしよう

leave a comment »

sql_server_management_studio_001_mid_640_480

学校の校務支援システムの運用には様々な課題があるが、とりわけ大きい課題がシステム移行時に発生する。既存システムから生徒の氏名住所などの基本情報や、履修情報、成績情報を新システムに移行しなければならないが、その作業と責任は、そのときの学校の担当教員に負わせられることとなる。既存システムの業者も、新システムの業者も、一定の技術情報は提供しても作業に関してはどちらも助けてはくれない。

学校として学籍管理のデータを扱う場合、管理の手法はシステムによって異なる。生徒の氏名や住所、生年月日などの基本データに大きな違いはないだろうが、教科科目の情報、成績管理の手法はシステムによって違いが大きいと考えられる。既存のシステムからエクスポートしたデータを新システムでそのまま使えるとは考えにくい。

そこでデータ処理をする必要がおこるが、業者がデータ移行ツールなどを用意することはない。そこでデータ移行においてデータ処理をする必要が生じるが、これをエクセルなどの表計算ソフトで行うと重大な間違いがおこる危険がある。また一度で完全に移行できることも考えにくいので、ある程度の試行錯誤が必要となる。そのたびに表計算ソフトでデータ加工をしていては手間がかかりすぎ、また事故がおこる危険が大きい。

そこで SQL Server にデータを読み込んで処理することが最も正しい解決策だ。できれば既存システムから SQL クエリによってデータを読み出したいところだが、それができなければ何らかの形でデータをエクスポートすることになるだろう。多くのシステムでエクセルや CSV の形式でデータを取り出すことができるようになっているはずだ。

sql_server_management_studio_006_mid_640

このとき、既存システムで使われるフィールドと新システムで使われるフィールドに違いがあったとき、これを表計算あるいは CSV のデータ上で加工してはいけない。もし新システムで使わないデータフィールドがあったとき、心情的にはデータを切り捨ててインポートしたい欲求は理解できる。余計なフィールド設定をせずに済ませたいだろうからだ。

またフィールド名を修正したい欲求にもかられる。しかしエクスポートしたデータを手作業で加工してはいけない。既存システムからエクスポートしたデータは、そのまま SQL Server にインポートできるようにテーブルを作っておくべきだ。

sql_server_management_studio_003_mid_640_480

データの移行は一回で終わることは、まず、ない。既存システムのデータを新システムにインポートするには、何度かの試行錯誤が必要となるはずだ。またすべてのデータを一度に移行しようとして間違いがあれば修正も困難になる。小さなデータを試験的に移行しながらチェックを繰り返し、うまく移行できることを確かめてから全部のデータを移行するだろう。

このとき、エクスポートしたデータを手作業で加工する工程を挟むと、そのたびに手作業が必要となる。手作業には誤りがつきまとい、とりわけ同じ作業を何度も繰り返していると誤る危険性が高くなる。

新システムで使わないフィールドの設定はせずに済ませたい、おかしなフィールド名は修正したい気持ちになることは理解できるが、ここで手間を惜しまず、エクスポートしたデータは無修正でそのままインポートできるように SQL Server のフィールド設計をしよう。

2019年1月2日

松本 吉生(まつもとよしお)

Microsoft MVP Data Platform
1961年京都に生まれ、神戸で幼少期を過ごす。大学で応用化学を学んだのち、理科教諭として高等学校に勤務する。教育の情報化が進む中で校内ネットワークの構築運用に従事し、兵庫県立明石高等学校で文部科学省の「光ファイバー網による学校ネットワーク活用方法研究開発事業」に携わる。兵庫県立西宮香風高等学校では多部制単位制の複雑な教育システムを管理する学籍管理データベースシステムをSQL ServerとInfoPath、AccessなどのOfficeソフトウエアによるOBA開発で構築・運用する。2015年から2017年まで兵庫県立神戸工業高等学校でC#プログラミング、IoTなどのコンピュータ教育を行い、現在は兵庫県立神戸甲北高等学校に勤務する。2004年からマイクロソフトMVP(Microsoft Most Valuable Professional)を受賞し、現在15回目の連続受賞。2016年にマイクロソフト認定教育者(Microsoft Innovative Educator Experts : MIEE)を受賞し、現在4回目の連続受賞。

校務支援システムの更新 – 01 – データ移行は現場教員の責任となる – データ移行作業は SQL Server を使おう

leave a comment »

高等学校の成績処理などにデータベースを使うようになったのは、単位制や総合学科など講座の選択肢が多い学校ができてからだ。基本的にクラス単位で授業を行う普通科高校では、出欠や成績の管理にデータベースを使う必要はなかった。クラス単位で紙ベースの出席簿や成績伝票での処理で十分だったからだ。しかし生徒が多くの講座に分かれて受講する単位制や総合学科の高校では、紙ベースの処理が不可能だ。

筆者も他部制単位制の兵庫県立西宮香風高校に勤務したとき、SQL Server を使った校務支援システムを作り運用した。多くの単位制や総合学科の学校で業者と契約して作られたシステムを運用していたが、新しいタイプの他部制単位制高校に合うシステムはなかったからだ。

近年、単位制や総合学科ではない普通科の高校でも校務支援システムを導入する動きがある。それは普通科の学校でも多様な選択肢を用意した選択講座のカリキュラムを拡大することも背景にある。契約や運用の面からクラウドベースの統一システムを都道府県単位で一括契約するケースも増えてきた。

このような校務支援システムの運用にはいろいろな課題があるが、システム更新のときに大きな課題がある。別システムへの更新時に、過去のデータを移行する作業が必要となるのだ。このデータ移行の作業は現場の教員にまかされる。既存システムの業者も、新しいシステムの業者も、どちらも何もしない。責任もとらない。

データの移行は、そのときの担当教員にとって大きな責任を負わせられるものとなる。在校生の成績データを一つ残らず完全に新システムに移行しなければならない。この作業をエクセルなどでやっていては大きな間違いがおきる危険性がある。データ移行の作業は SQL Server を使うことが最も良い。

sql_server_management_studio_001_mid_640_480

既存システムのテーブルにあわせて SQL Serever にテーブルを作る。既存システムからエクセル形式や CSV 形式でエクスポートしたデータを一括で SQL Server に読み込む。例えば高等学校の校務支援システムでは中学校情報を管理するが、中学校コードは既存システムと新システムで異なることがあるだろう。このとき、まず既存システムの中学校コードと新システムで利用するコードを一括で SQL Server に読み込んでおく。

sql_server_management_studio_002_mid_640_480

sql_server_management_studio_003_mid_640_480

sql_server_management_studio_004_mid_640_480

そして既存システムのコードと新システムのコードを関連付けたビューを作り、これを他の情報と関連させる。

sql_server_management_studio_005_mid_640_480

SQL Server で一元的にデータ処理を行うことで、間違いのないコード変換処理をすることができる。SQL Server で正しい変換テーブルとビューを作っておけば、既存システムからのデータ移行作業を手間なく、そして誤りなく何度もテストし確かめることができる。

2019年1月1日

松本 吉生(まつもとよしお)

Microsoft MVP Data Platform
1961年京都に生まれ、神戸で幼少期を過ごす。大学で応用化学を学んだのち、理科教諭として高等学校に勤務する。教育の情報化が進む中で校内ネットワークの構築運用に従事し、兵庫県立明石高等学校で文部科学省の「光ファイバー網による学校ネットワーク活用方法研究開発事業」に携わる。兵庫県立西宮香風高等学校では多部制単位制の複雑な教育システムを管理する学籍管理データベースシステムをSQL ServerとInfoPath、AccessなどのOfficeソフトウエアによるOBA開発で構築・運用する。2015年から2017年まで兵庫県立神戸工業高等学校でC#プログラミング、IoTなどのコンピュータ教育を行い、現在は兵庫県立神戸甲北高等学校に勤務する。2004年からマイクロソフトMVP(Microsoft Most Valuable Professional)を受賞し、現在15回目の連続受賞。2016年にマイクロソフト認定教育者(Microsoft Innovative Educator Experts : MIEE)を受賞し、現在4回目の連続受賞。

2012年12月29日(土)、「第9回アドミンティーチャーズ勉強会(大阪)~それで使ってるつもりですか?Microsoft Office、Microsoft MVPが正しいOfficeの使い方を伝えます~」のご案内

leave a comment »

年末のあわただしい折ではあるが、2012年12月29日(土)に表記の勉強会を開催することにした。この勉強会では、Excel、Word、PowerPoint、の著名なMicrosoft MVPの方々にお話をいただく。不肖私はInfoPathやSQL Serverについてのお話をさせていただく。

4人のMVPでテーマを相談したとき、いくつかの案があった。それは、たとえば「誰も教えてくれなかった、Officeソフトの使い方」、「知って得するOfficeの作法」、「あなたの知らないOffice」といったものだった。とにかくこの4人のMVPはOfficeが大好きで日々仕事や日常生活の中で使いこなしている方々だ。特にExcelの田中さんは数々の著書もある有名な方で、きっとセッションの中で役に立つことをたくさんお話しいただけると思う。休憩時間での質問も大歓迎だ。

いろいろと忙しい年末だと思うが、ぜひ多くの方に来ていただきたい。懇親会もあります。

参加は、アドミンティーチャーズWebサイトから電子メールで申し込みを。

http://adminteachers.wordpress.com/2012/12/07/%e7%ac%ac%ef%bc%99%e5%9b%9e%e3%82%a2%e3%83%89%e3%83%9f%e3%83%b3%e3%83%86%e3%82%a3%e3%83%bc%e3%83%81%e3%83%a3%e3%83%bc%e3%82%ba%e5%8b%89%e5%bc%b7%e4%bc%9a%ef%bc%88%e5%a4%a7%e9%98%aa%ef%bc%89%ef%bd%9e/

アドミンティーチャーズWebトップページ

http://adminteachers.wordpress.com/