コンテンツにスキップ

2.3 論文のフォーマット

2.1.1 全角文字と半角文字

  • 全角:文字(カタカナを含む)やカッコ,句読点
  • 半角:欧文表記および式,数字,量記号,変数,単位
  • 句読点:「,」と「.」,「,」と「。」,「、」と「。」などいろいろな組み合わせがある。どの組み合わせを使っているか確認してそれに合わせよう。パソコンの「かな漢字変換システム」を用いるといい。しかし、最後は個別に確認しましょう。

2.3.2 数式

変数および量記号は,半角のイタリック体(斜体)で示す。数字および「=」「+」「-」などの数字記号,単位は半角のローマン体(立体)とする。式と本文でフォントとローマン/イタリックが異ならないようにする。 式の書き方は次の2通りある。どちらかに統一しよう。

例にあるように,分野が異なれば同じ量記号を異なる物理量に用いることがある。数式で使用する量記号や変数は,必ず本文で説明すること。 数式の配置は,本文中央揃え,または 3 文字くらいの左インデントを付けて,など論文集のフォーマットに合わせる。数式には,(1)のように式番号を示す。本文で式に言及するときは,「式(1)」のように書く。「(1)式」は NG。

2.3.3 数値と単位の表記

[1] 単位

単位は,本文,式ともに国際単位系(SI) および例外単位(JIS Z 8203:2000 に規定されている)を用いる。

  • 数字と単位は別の単語。だから,間に半角スペース( )を挿入る。× 3km 〇 3 km
  • 単位は1つの単語として扱う。× m / s 〇 m/s
  • m/s と$m \cdot s^{-1}$のどちらの記載方法もある,どちらかを用いるかは研究分野の流儀に従うこと。
  • 時間の SI 単位は秒[s]だけど、例外として時[h]や分[min]も認められている。

[2] 単位のカッコ

国際規格 ISO 80000 では, 数値に続く単位にはカッコを付けない。学術誌や書籍にはそれぞれ流儀がある。

  • 文部科学省検定教科書:量記号(変数)の後の単位は$f$〔Hz〕のように亀甲カッコでくくり,数値の後は 3kHz のようにカッコなし。
  • 和文教科書・学術誌:$F$[N],3[m]のようにブラケットでくくる。量記号と数値どちらだけに[]を用いるのもある。
  • 欧文教科書・学術誌:3kPa のようにカッコなしが一般的。0.1(m)のように丸カッコ用いるものもある。
  • %は単位か? 単位じゃないから,カッコは基本使わない。
×な例 45.6〔%〕
○な例 45.6%

2.3.4 見出し

「章」「節」「項」「目」の見出しは,卒論集や学術誌のフォーマットに合わせる。 alt text

2.3.5 フォント・ポイント

フォント

  • 明朝体:千年以上も昔に木版印刷のために毛筆の楷書体を模してつくられたフォント。国内の書籍や新聞,雑誌で使われがち
  • ゴシック体:すべての線がほぼ同じ太さにみえるようにデザインされた書体。画面上で表示サイズを変更するのに適しているため, Web ページやスマホで使われがち

論文は,本文は明朝体フォントを使用する。明朝体フォントには,MS 明朝,小塚明朝,游明朝などの種類がある。投稿規定を確認して使用する必要がある。フォントの指定がないときは MS 明朝などの等幅フォント(⇔ プロポーショナルフォント)を使おう。
等幅フォントを使う理由は、同じ幅の行には同じ文字数が入り,横方向の見た目もそろう。編集が楽になる。

ポイント

文字サイズの単位。9 ポイントが一般的,指定サイズを使用しよう。

2.4 統計検定

2.4.1 なぜ統計を用いるのか

論文では,新たなアイテムに用いる材料や方法,開発したアイテム,あるいは長期間使用して劣化したアイテムを測定して結果を示す。測定の目的は,次のアイテムに採用するアイデアの有効性を予測することである。 測定できる回数は有限で,そこから得た特性値は,たまたま優れている,劣っているなどばらつく可能性がある。アイデアの有効性を予測するためには,アイデアを用いたアイテムがどのような特性になるかを少ないサンプルから予測することが求められる。→そこで統計を利用する

2.4.2 母集団とは

母集団:対象全体。$N$個 サンプル:母集団から抽出された一部のデータ。$n$個 測定の目的を達成するためには,$n$個のサンプルから$N$個の母集団を測定できればよい。 alt text

2.4.3 平均値だけではわからない

  • 平均値を比較しただけで「増加した」とはいえない
  • 実はグループ A とグループ B それぞれ平均値は同じで,異なるのはデータのばらつき
  • 差を議論するときは,平均値だけでなくばらつきも考慮すること alt text

2.4.4 分散

データのばらつきは,$(平均値からどれだけ離れているか)^2の平均値$で表される。

2.4.5 正規分布

正規分布とは,確率密度関数である。 ある測定値 x が出現する確率は,母集団の平均(母平均)$μ$と分散(母分散)$σ^2$を用いて 正規分布の式は複雑だから,$N(μ,σ^2)$と置き換えて示す。 alt text

2.4.6 サンプルから母集団を推定する

われわれが測定できるのはあくまで,母集団から取り出した n 個のサンプルから求めた標本平均と標本分散 → そこから母集団の母平均$μ$,母分散$σ^2$を推定する。サンプル数を増やせば近づくけどコストがかかる。少ないサンプル数で推定する必要がある。
いま,標本分散は母分散より小さな値を取ることがわかっている。そこで,n ではなく n-1 で割った不遍分散$u^2$を使う。 n-1 を自由度と呼ぶ。

2.4.7 標準偏差

平均値と次元が同じ,不偏標準偏差$u$を用いて母集団のばらつきを表す。 標本標準偏差$s$は測定値のばらつきを表した値だが,不偏標準偏差$u$は母集団の標準偏差$σ$を推定した値 Excel では STDEV.S()関数を用いて求める。 正規分布では確率的に,平均値 ±SD の範囲に全要素の 68.3%を,平均値 ±2SD の範囲に全要素の 95.5%を含む。 alt text

2.4.8 母集団から取り出したサンプルの平均値

正規分布$N(μ,σ^2)$を示す母集団から n 個のサンプルを取り出して平均値を計算する。その操作を繰り返していったとき,その平均値の集合も母集団と同じく正規分布することがわかっている。 このとき,平均値の集団の分散は,母分散をサンプル数 n で割った値になる。

2.4.9 t 分布

平均値の集団は,正規分布$N(μ,σ^2/n)$を表すけど,測定時に母分散を知ることはできない。そのため不遍分散$u^2$を持用いる。 その置き換えをすると正規分布とは若干異なる分布を示す。これを t 分布と呼び,$t(μ,u^2/n)$と表す。 サンプル数 n が大きくなると、t 分布は正規分布に近づく alt text

2.4.10 標準誤差

t 分布の分散の平方根を標本平均の標準誤差(=SEM)または標準誤差(=SE)と呼ぶ ここでの標準誤差は「母平均に対する標本平均の推定精度」

2.4.11 標準偏差と標準誤差

工学系論文では,製品の品質を重視するため、「平均値 ±SD」を示すべき 平均値 ±SE は母集団推定の精度を表し,平均値 ±SD はばらつきそのものを表す。

2.4.12 データの比較

条件を変えて製作した 2 種類のアイテムの特性に差があるかどうかは、統計検定を用いて調べる 代表的なパラメトリック検定(=母集団がある特定の分布(正規分布など)に従うときに用いられる検定法)はt 検定 t 検定に関しては以前 2.3 でやったので省略します。以前輪講した卒論の攻略本 Excel の T.TEST()関数を用いて t 統計を求めることができる。使い方は省略します。本を参照してみてください(p160)。

2.4.14 サンプル数について

厳密にいえば、やりながら例数を決めるのはデータのねつ造ともいえる、、 測定に要する時間・費用・労力が許すなら 10 例、いずれかが足りないなら 6~7 例と、決めた例数を測定してから検定を行うべき

2.4.15 2 値変数の比較 (カイ 2 乗検定)

成功/失敗などの 2 値変数を比較する場合 →$χ2$(カイ 2 乗)検定を用いる

例:2 つの顔認証アルゴリズム A と B があり,A の成功率は B を 9%上回っている。

  • 偶然かも?
  • 帰無仮説「A と B の認証成功の割合は等しい」
  • Excel を使って$χ2$統計値が偶然に発生する確率を計算する場合 → CHISQ.TEST(実測値範囲, 期待値範囲)関数を用いる
  • $χ2$統計値が有意水準を下回っていれば,帰無仮説が棄却される。
  • 今回は p=0.063 と 5%を超えているため,棄却されない。 論文への書き方:「$χ2$検定を実施したところ,p=0.063 であり有意差はみられなかった」

$χ2$検定の場合、試行回数が多ければ、成功率は同じでも p 値は下がる → 有意差を認めたと主張できる なぞ:無限にやれば有意差認めることができるってこと?

2.4.16 3 グループ以上の比較

t 検定や$χ2$(カイ 2 乗)検定は 2 グループの比較に用いられる。繰り返し用いて多数のグループに適応すると精度が下がるため NG

  • 3 グループ以上の比較では ANOVA などの多変量解析手法を用いよう

2.4.17 その他

  • 論文に標準偏差を示すときは,「測定値は,平均値 ± 標準偏差(SD)として示す」のように何を示すのか明示しよう。
  • 平均値 ±SD では平均値の 1 桁下までの SD を示す
  • 統計検定では,p 値を 2 桁の有効数字として示す
  • 論文内では同じ有意水準を用いる