健康ログデータ分析 |
生体ログデータ分析の目的は、本プロジェクトによって得られた集団の生体ログデータ の分析を通して、活動量計に基づく行動パターンと体組成指標の関係についての知見を得 ることである。分析で具体的に取り扱う生体ログデータとは、活動量計で得られる歩数、 活動エネルギー量、消費エネルギー量、脂肪燃焼量等の人々の日常の生活行動により発生 する変数群(以降、活動変数群)および一定間隔を置いて定期的に体組成計によって測定 される、体重、血圧等の体組成に関わる変数群(以降、体組成変数群)である。
これらの変数群および年齢、性別、職業等の活動に関わる基本属性データを 6,000 人 以上の生体ログデータとして収集し、N市の協力で 提供された市民データを用い、汎用データ分析ツール、ビジュアルアナリティクス ツールを用いて下記の項目の分析を行った。 (1) 歩数による活動量推移パターンの潜在的類型化と体組成指標との相関分析 (2) 成人男女の体型・隠れ肥満評価指標の開発 (3) 開発指標に基づく増減量の時間的推移および地理的パターンの分析 (4) 全国の歩行データからの日内・週内活動パターンの抽出 (5) 全国の歩行データとN市との比較研究 (6) 歩行と体組成のパネルデータの作成 (7) N市における活動量計データと体組成計データの関連の検討 (1)歩数による活動量推移パターンの潜在的類型化と体組成指標との相関分析
被験者各人の週単位の歩行総数の推移データに基づき、その累積パターンに関して混合 成長曲線モデルを適用し、集団の活動量推移に関する潜在的類型化を試みた。また、得られた歩数の累積パターンと代表的な体組成指標との相関分析を行い、活動量の多少が体組 成に与える影響を検討した。 今回の結果からは 4 週間程の経過週数 では、内臓脂肪に変化がみられないが、歩数増加パターンの違いによる対象者の内臓脂肪 レベルは異なる。つまり、歩数のより多い群に所属する対象は、内臓脂肪レベルが単調に 低下する結果が得られた。 (2)成人男女の体組成指標の分布に基づく体型・隠れ肥満の評価指標の開発
本分析では、成人男女の被験者集団において体組成指標がどのように分布しているかを 表示し、その相関構造に基づいて体型と隠れ肥満の2つの評価軸のための評価指標を開発 した。さらに、2 つの評価指標について動的特性を探ることで、体組成指標の短期的な増 減と中長期的な増減に異なる特性が現れることを発見した。 成人男女の FMI と LMI の散布図
上の散布図における男女ごとの体組成指標の分布は、回帰直線方向に幅広く分布し、その法線方向はばらつきがやや小さい。そこで、男女ごとの体組成指標に主成分分析を施して、下図のように分布の長軸成分と短軸成分へと分解を行った。すると、長軸成分と短軸成分はほぼ独立に分布しており、これらの成分を独立な 2 軸の体組成評価指標として用いることができる。
ここで、長軸成分は体脂肪量と除脂肪量が同時にバランスよく増減するため体型として の肥満度を表すものと解釈され、短軸成分は主に体脂肪量と除脂肪量の構成割合を変える ため隠れ肥満度を表すものと解釈される。したがって、下図の座標軸により中心化された長軸成分を「体型指標」、短軸成分を「隠れ肥満指標」と名付け、前者は体型としての肥満 ⇔痩身を、後者は同体型の集団における相対的な隠れ肥満⇔固太り(筋肉質)を評価する指標として利用することを提案した。 主成分分析による体型指標(長軸成分)と隠れ肥満指標(短軸成 分)
(3) 開発指標に基づく増減量の時間的推移および地理的パターンの分析
上で開発した体型と隠れ肥満の評価指標について、その動的特性を探るため、両指標の月次推移データをまとめた上で、その月変化量と年変化量の関係を分析した。 男女ごとの月変化量と年変化量の分布を下の散布図に示した。上側の月変化量と下側の年変化量とで、縦軸の隠れ肥満指標の変化を比較すると、分散は年変化量の方がやや大きいものの、変化の範囲はほぼ変わらず、隠れ肥満指標は長期的に変化しづらいことがわかった。一方で横軸の体型指標の年変化量は幅広く分布しており、長期的に減量を継続させるには体型指標に沿って体脂肪とそれ以外とをバランスよく減量させた方がよいことが考察できる。 体型指標と隠れ肥満指標の月変化量、年変化量の散布図
被験者集団における肥満傾向の地域差を分析するために、上で開発した体型と隠れ肥満 の評価指標を居住都道府県ごとに集計し、その平均値を算出した。
全体的な傾向として、東北地方~北海道と四国地方~九州地方にかけて、各指標の平均 値が高く、すなわち相対的に肥満傾向にあることが窺える。また、年代間で比較すると、 体型指標はあまり変わらないものの、隠れ肥満指標には年代間で大きな差があり、20 歳 以上 39 歳以下ではっきりと見えなかった地域的傾向が 40 歳以上 59 歳以下では顕著となっている。体型指標が高い地域は概ね、隠れ肥満指標も高くなっているが、東北地方の女性に関しては体型指標およびメタボリック・シンドローム該当率が高いにも関わらず隠 れ肥満指標は低いという特異な傾向も見られる。本分析で開発した体型指標と隠れ肥満指標について、メタボリック・シンドロームと一定の整合性が取れていることが確認された。 (4) 全国の歩行データからの日内・週内活動パターンの抽出
本解析では、2013 年 4 月 1 日から 2014 年 3 月 31 日の期間に活動量計により計測された被験者・計測日別の 1 時間ごとの歩数データを解析に用いた。ただし、1 日の歩行活動がほとんど漏れなく計測され、かつ明らかな異常値のないデータに絞るため、次の 3 つの条件を満たす計測日を抽出した。 ① 1 日 10 時間以上の活動記録がある ② 1 日歩数 50000 歩以下 ③ 1 時間当たり歩数 8000 歩以下 さらに、月曜日から日曜日まで連続で上記を満たす計測が行われた週のみを抽出し、1 週間分の日時別歩数を 1 個の解析データとして解析に用いた。その結果、解析に用いられ たデータは 742 名の被験者により記録された 7,376 週分の日時別歩数となった。なお、 活動量計を装着していないことにより歩数が計測されていない時間帯については、大きな 活動がないために装着していないものと見なし、すべてゼロで補間した。 以上による分析の結果として得られた4種類の日内活動パターンおよび6種類の週内活 動パターンについて、その歩行割合の分布を下図に示した。活動パターンの分類数はさら に増やすことも可能であるが、解釈のしやすさの観点から上記の分類数とした。 4種類の日内活動タイプの時間帯別歩行割合
6 種類の週内活動パターンの日内活動パターン×曜日別歩行割合
上図の 4 つの日内活動パターンには、昨年度の分析と同様に、明確な活動時間帯の特徴 があり、それぞれの日内活動パターンを次のように名付けた。
通勤活動:朝夕の通勤時間帯(7~10 時と 16~20 時)および昼食時間帯 (12 時台)に活動するパターン。 日中活動:日中の 9 時から 17 時にかけてほぼ均等に活動するパターン。 夜間活動:主に夜の 19 時から深夜にかけて活動するパターン。 早朝活動:主に早朝の5時から 8 時にかけて活動するパターン。 また、上図の 6 つの週内活動パターンは以下に名付けるように、下位トピックの日内活 動パターンごとに大きく分かれ、さらに、通勤活動と日中活動については主に平日に限定 した活動と土日に限定した活動とに分かれた。 平日通勤活動:主に平日(月曜から金曜)の通勤活動からなる活動パターン。 休日通勤活動:主に土曜と日曜の通勤活動からなる活動パターン。ただし、 平日の日中活動も若干含んでいる。 平日日中活動:主に平日(月曜から金曜)の日中活動からなる活動パターン。 ただし、土曜と日曜の日中活動も若干含んでいる。 休日日中活動:主に土曜と日曜の日中活動からなる活動パターン。 毎日夜間活動:1 週間を通した夜間活動からなる活動パターン。 毎日早朝活動:1 週間を通した早朝活動からなる活動パターン。 (5) 全国の歩行データとN市との比較研究
より多くの歩数を記録していた群 である程、内臓脂肪レベルの値が小さく、より標準的な内臓脂肪量である この成果を踏まえ、小さな内臓脂肪レベルを持つ群と同様な歩数を記録するこ とで、標準的な内臓脂肪量を目指すための歩数の目安を作成した。 また、この目安を適用し、全国とN市から提供のあった歩行データとの比較研 究を行った。具体的には、全国とN市のデータのそれぞれに目安による基準を適用し、 歩数記録の多さの違いによって各データを4群に分類し、年代、性別ごとに比較を行った。 歩数の目安を作成する際の概念図
まず 20~30 代男性は、全国では第 2 群、N市では第 4 群が多かった。N市の分析対象者の歩数ペースは、全国データに比して高いと言える。次に 40~50 代男性につい ては、全国とNで棒グラフが同様の形状していた。また、60~80 代男性も全国とNで棒グラフの形状が類似しており、これらのデータの分布が似通っていることが確認でき た。 女性に関しては、20~30 代女性が全国で第 3 群が多く、Nで第 4 群が多かったこ とが分かった。40~50 代女性、60~80 代女性に関しては、全国データの棒グラフが第 1、第 2 群にウェイトが大きいことに比較して、Nデータはやや第 3、4 群の方に割合が多く、女性のデータは全国データに比較してN市の歩数記録が多いことが確認できた。
週内活動パターンを全国の歩行データとN市から提 供された歩行データにそれぞれ当てはめ、全国とN市の活動パターンの違いについて分析を行った。全国とN市を比較すると、20 代と 30 代の男性はN市の方が夜間活動が多いことがわかる。また、20 代と 30 代の女性はN市の方が早朝活動が少ないことがわかる。 一方、50 代以上では、男女ともにN市の夜間活動は概ね全国に比べて少ない傾向にある。さらに、60 代以上の男性は、平日・土日ともにN市の通勤時間帯の活動が全国に比べて少ない傾向にある。このように、N市の週内活動パターンの構成は全国に比べて いくつかの特色があることが判明した。 (6) 歩行と体組成のパネルデータの作成
2013 年 4 月から 2014 年 3 月までのデー タを用いて、1年分の記録を用いて統合したデータの作成を行った。 作成を行った 1 年分の統合データをもとに、パネルデータの作成を行った。パネルデー タとは、同一の参加者を対象として、同一の測定を複数の時点において行ったデータのこ とを指す。この形式のデータの特徴としては、同一対象の記録や態度の、各時点による変 化を観察できることが挙げられる。また、各層(コホート)ごとにデータを集計した形式 も可能であるため、各個人のプライバシーを考慮した上での、データのオープンソース化 にも資する可能性がある。 (7) N市における活動量計データと体組成計データの関連の検討
N市から提供のあった活動量計と体組成計の関連性の検討を行った。新たな取り組みとして、活動量計から得られるデータのうち、歩数ではなくエネルギー量 に着目して活動強度を算出し分析を実施した。具体的には、曜日・時間別の活動強度パタ ーンと体組成指標の特徴的な因子を抽出したうえで関連を検討した。 肥満軸、筋肉軸、体幹筋肉軸という 3 つの従属変数を用いて、それぞれ主成分回帰分析 を行ったが、筋肉量や脂肪量という点からは似たような結果が得られた。筋肉量が多い人 (28-1) 57 は土曜日や日曜日といった休日の午前中の活動が、脂肪量が多い人は深夜の活動がより活 発な傾向を示すことが明らかになった。50 代に限定して考えると、休日の活動は体組成 との関連は見られず、筋肉量に関しては平日の活動によって、脂肪量に関しては深夜の活 動によって規定されていることが分かった。 |