「おいしさ」は、まず見た目から

新年、あけましておめでとうございます。

2017年も食品業界では、新製品が続々と登場するのでしょうね。スーパーやコンビニには、たくさんの似たような種類の商品が陳列されている時代に、新しいものづくりへのチャンレンジを続ける開発担当者には、本当に頭が下がります。消費者の一人として、良い意味で期待を裏切られるような新しい感覚の食品に出会うのが楽しみです。

消費者の期待を満たす、あるいは超える商品こそが、ロングセラーに繋がる、延いては企業に利益をもたらすものでしょう。それには、価格やパッケージ、広告だけでなく、中身の品質が、消費者の購買動機を満足させるものでなければなりません。

人は、五感を駆使して味わうわけですが、一番最初に遠位性感覚である視覚が優位に働きます。つまり、食品の外観を見て、それを美味しそうとか、新鮮そうとか、判断が始まります。そして、口にしたときは、見た目が影響して、呈味成分量以上に苦く感じたり、甘く感じたり、味への相互作用も働きます。

色や形状などを官能評価するときは、環境(明るさなど)の制御が必要となります。また、分析的に色を測定するには、一般的に分光測色計が用いられますが、小さい範囲(直径で2〜10cm程度)を平均化してL*a*b*などの色指数で表現するので、なかなか不均一な食品の見た目と相関させることが難しいです。

一方、アルファ・モスのビジュアルアナライザー IRISは、一定光源のボックス内に置いたサンプルの画像を高分解能のCMOSセンサーで取得し、最先端の画像処理および多変量解析ソフトウェアを駆使して外観の差を数値化する仕組みです。

IRIS

最大測定面積が27cmx39cmなので、大きな食品サンプルであっても目視で観察するのと近い条件で評価することができ、全体な色のバランス(1ピクセルごとに色を数値化)、形状、大きさ情報を得ることができます。こうしたデータは、消費者の嗜好を予測する説明変数として用いることで、好みに影響する色(素材)、形状などを同定することができます。

あなたは、どちらのハムを食べたいですか?

IRIS ham

QDAデータの解析と解釈(最終章)

久しく更新が滞ってしまいましたが、2016年の最後でこれまで続けていたQDAプロセスに関する連載をまとめたいと思います。

前回は、パネルのパフォーマンスの評価について書きましたが、サンプル間の差の有効性を結論づける際、交互作用の効果を知ることが大切です。交互作用は、繰り返し試験をした二元配置分散分析によって誤差項から分離することができます。つまり、1回だけの試験では明らかにできません(繰り返しの試験が、QDAの本質です!)

交互作用には、相殺効果と相乗効果の2つのタイプ(下図)があり、パネリスト間の感度、または尺度の使い方に違いがあることを考えれば相乗効果に有意差が出ることはそれほど問題ではありません。もし相乗効果の交互作用があるときは、スコアを順位に変換して解析することもひとつの手段です。それに対して、相殺効果はサンプル間の順位の違いを反映するのでより解釈に注意が必要です。

qda7-1

一般的なQDAデータの二元配置分散分析の一例を下表に示します。
qda7-2

分散分析でサンプルの効果に有意差が見つかったとき、どのサンプルに差があるかを確認するために多重比較検定を行います。多重比較検定には、Duncan、Newman-Keuls、Scheffe、Tukey (a)、Tukey (b)、LSD、Dunnettなど多くの手法がありますが、主に第1種の過誤と第2種の過誤のどちらを重点的に保護するかを考慮し、選択することになります。前者ではTukeyが、後者ではDuncanがよく利用されています。

また、サンプル間の違いを視覚化するために利用されるのが、主成分分析です。属性間の相関を利用してQDAデータに含まれる多くの情報を抽出、集約する方法で、新しい2軸上にサンプルを分類し属性との関係をよりよく理解することができます。

qda7-3

最後に・・・製品の官能的特徴を日常用語で記述し数値化した記述分析データは、消費者の嗜好、購買意欲、用途、イメージなどの市場調査データと関連付けて用いることで、製品の強み・弱みを明らかにし、マーケティング部門と開発部門との橋渡しに貢献します。もちろん、機器分析データの相関づけにも最適です。

さて、今年も一年間お世話になりありがとうございました。
来年は、これまで度々紹介してきました「官能評価と機器分析のデータの活用」から、少し触れていきたいと思っています。

では、2017年が皆様にとって実りのある年となりますように。。。

QDAデータの解析と解釈(1)

先日、Dr. Herbert StoneによるQDAワークショップを開催致しました。Stone先生と一緒に仕事をし始めて10年以上になりますが、官能評価の認知や向上に懸ける強い思いは相変わらずで、精力的な活動に大変頭が下がります。今回も多くの皆様にご参加頂き、ありがとうございました。QDAに関して、より理解を深めて頂ければ幸いです。

さて、QDA法のデータをとったあとの解析は、一般的に難関のようです。今回のワークショップのアンケートでも、難しいという声が多かったです。

QDAデータの解析には、基本記述統計のほか、分散分析と多重比較検定、それに多変量解析(主成分分析など)が行われます。機器分析データがあれば、各属性との相関を求めたり、あるいはQDAデータと分析データを組み合わせ、回帰分析で消費者の受容度の予測モデルを構築したりすることも可能です。それによって、官能評価の負担を軽減させられ、さらに客観性が高まるので、企業にとっては大いにチャレンジする価値があります。

とはいえ、QDAデータの解析のコアとなるのは、何と言っても分散分析です。まず、一元配置分散分析で、パネリストのパフォーマンスを評価します。下図のグラフ(FIZZにより出力)は、属性「つや」に関して、パネリストの識別感度を示すp値(横軸)と、繰り返し評価の変動を示すCV Anova(縦軸)をプロットしたもので、右下にプロットされるパネリストほど製品間のつやの違いを識別しており、かつ評価の再現性が良いことを示します。識別の目安をp値で最大0.5としたとき、つやを識別できていないパネリストが3名いることが分かります。

分散分析

しかし、パネリスト一人がすべての属性に関する違いを検出できることは期待されません!そのために、約12名ものパネリストを使うのです。また、すべての属性で、サンプル間の違いが検出されることも期待されません。属性は十分理解されていたのか、サンプル間に本来差があったのかについて、次の試験前に再度ディスカッションを行うことが現実的です。

QDA法(6)準備ができたらデータ収集!

QDA試験前にすべきことは、これまで出現した用語の整理や、セッションで用いるサンプル数(食品であれば6〜8検体)、サンプル量、提示間隔など試験プロトコルの確立です。

パネルリーダーが、評価の仕方に関して統制を図ります。また、用語の定義を完成させることは重要です。もし、重複する意味の複数の用語をひとつにまとめるときは、除かれた用語を残された用語の定義に加えることができます。

そして、いよいよ本試験です。
QDAのトレーニング後は、できるだけ期間をあけないでデータ収集を行うことが望ましいです。人の記憶は覚えるのに時間がかかる割に、忘れるのはあっという間ですから。本試験では、モナディック(単一のサンプルのみを試験する)法でデータを収集します。

ひとつのサンプルとスコアカードを提示し、その評価後に両方回収してから次のサンプルとスコアカードを渡します。最近では、FIZZのような官能評価ソフトウェアがあるので、利用することでペーパーレスで試験が行えますし、回答漏れを防ぐこともできます。

サンプルの提示順序は、複数刺激の順序効果を防ぐためにパネル内でランダマイズ化します。そして、試験は必ず繰り返し(通常3回〜4回)行います。その分、時間はかかるため省略されがちですが、分散分析での誤差と交互作用(サンプルxパネル)を分離するために必須です。

QDAtest

新年のご挨拶

あけましておめでとうございます。
旧年は、途中でブログの更新頻度が減ってしまいましたが、今年は、なんとか挽回していきたいと思います。どうぞ本年もよろしくお願い致します。

さて、新年の幕開けと同時に、アルファ・モス・ジャパンの第9期がスタートします(今期から決算月が12月に変更となりました)。心新たに、官能分析手法の普及にさらに努めていきたいと思います。

アルファ・モス・ジャパンのミッションは、知覚の評価における機器分析と官能評価の科学的な融合です。昨年も、国内外の学会やセミナーで香りや風味の機器分析や官能評価事例を発表してきました。お陰様で、ユーザー様の具体的な成功ケースも増えてきています。
http://www.alpha-mos.co.jp/event/index.html

2016年上期には、次のようなプログラムを予定しています。

1月27日 TMS研究会
「イオン分子反応質量分析計の概要とリアルタイムガス、におい分析への応用」
2月3日 北海道食品加工研究センターセミナー
「におい分析の最新技術と食品開発・品質管理への活用事例」
3月上旬 Herbert StoneによるQDAワークショップ
5月18日〜 ifia JAPAN 2016
6月5日〜 ISOT2016
17th International Symposium on Olfaction and Taste
6月上旬 アルファ・モスユーザーフォーラム

今年も多くの場で、皆様とお会いできることを楽しみにしております!
SeasonsGreetings2016blog

においライブラリ

味には、甘味、酸味、塩味、苦味、うま味で表現される基本味があり、それらに由来する代表的な化合物の知見も多いですが、におい関しては、種類は多すぎて(40万種類とも言われています)、決まった言葉がありません。QDAにおける用語開発でも、においは形容詞で記述されることが多く、その解釈をつけるのに難しいことがよくあります。

清酒やビール、紅茶、コーヒーなど、特定の業界によっては、フレーバーホイールと呼ばれる用語リストが開発されていて、商品の風味(味や香り)の特徴を記述するときの基本として利用できます。これは、業界内の風味に関するコミュニケーションにおいて大変便利です。

Wine-Aroma-Wheel-Master-Sommelier_s
(出典元:http://www.aromaster.com/)

それでも汎用的なものは、なかなかありません。しかし、香気分析に関する学術論文を探っていくと、においに関する表現があちこちに目につきます。におい嗅ぎGGで分離された化合物に対するにおいの質も報告されています。ただ、問題はリソースがあちこちに点在していることです。

こうした文献情報を整理してデータベースにしたものが、アルファ・モスから発売されています。AroChemBaseは、保持指標に関する化合物ライブラリ(83500成分収録)であり、そのうち約2000成分のにおい質(芳香からオフフレーバーまで)や嗅覚閾値データが、10000 を超える豊富な文献から集められてひとつになっています。

収録されている情報量だけでなく、検索もいろいろな角度から行えます。感じたにおいの種類(甘い香り、カビ臭・・・)、推定される化合物(アルデヒド、硫黄系・・・)、またはサンプル名(コーヒー、レモン・・・)から・・・。まさに、においライブラリと言える機能を網羅しています。

arochembase_c

GC-O分析で、嗅ぎ分けた化合物のにおいをどのように表現したらよいのか困る時、GC-MSで同定された化合物が、いったいどのようなにおいなのか調べたい時、定量された成分濃度が、においを感じる量であるか確認したい時、AroChemBaseライブラリの使い道はたくさんありそうです。

QDA法(5)感覚尺度の使い方

これまで、QDA法の用語開発について書いてきましたが、そのプロセスの一部でもあるラインスケールについて今回は取り上げます。

ラインスケールの種類は様々です。

アンカーがないスケールであったり、
QDA5-1
アンカーをスケールの両端につけたものであったり、
QDA5-2
アンカーをスケールの内側につけたものであったり・・・。
QDA5-3

QDA法では、一番最後のアンカーを内側につけた長さ約15cmのスケールを使用します。スケールは、それより長くしても感度が上がらないことが確認されており、また逆に短くすると感度が下がってしまうことが経験的に分かっています。

ラインスケールに、目盛りを振ることはどうでしょう?パネリストの目安のために、つけたくなりますが、QDAにおいては推奨されません。たとえば、真ん中に3つのアンカーをつけた場合では、応答の変動が10〜15%大きくなり、結果的に感度が減少してしまいました。

また、数値をスケールにつけるのも推奨されません。数値は、パネリストにとってのバイアスとなり、たいていは、自らの感覚を覚えるより、数値を覚えることに一生懸命になります。そして、マイナスの数値があれば、誰もがそれをネガティブなものをとらえてしまうでしょう。

このような理由で、現在のラインスケールが誕生しました。

qda5-4

アンカーの上には、各用語について尺度の方向性を示す用語をつけます。色の濃さであれば「暗い, 明るい」、香りの強さであれば「弱い, 強い」均一性であれば「不均一, 均一」などです。そして、パネリストは各評価用語について、感じた強度の位置にマークをつけます。

データ解析で用いられるスコアは、スケールの左端からの距離を算出したものです。紙での試験だと、物差しで測る手間と人為的ミスを考慮しないとならないですが、最近では便利なソフトウェアも発売されています。

ところで、どのようにこのラインスケールを使うのでしょう?パネリストは、用語開発中に評価する多くのサンプルを通じて、試験するサンプルカテゴリーが呈する強度に慣れます。クッキーの甘さであれば、このくらいの範囲か・・・など。そして、その範囲の中で、自らの感覚を基準化し、同じようにスケールを使うことに集中します。

周囲のパネリストがつける位置を気にする必要はありません。なぜなら、“正しい位置”は存在しないからです。とにかく、反復して評価する中で、自らの感覚強度に基づいて再現良くマークすることを心がけるだけです。パネルの中で、“位置合わせ”をすることで、感度の低下が起こります。また、それに費やすトレーニングは莫大なものです。

QDA法では、反復の評価を行い、パネル全体の平均を分散分析で評価します。そして、個人で強度の差があるのは自然と考え、むしろサンプルのスコアを順位に置き換えたとき、パネリスト間でその順位が逆転しないことをより重視するのです。

機器分析手法をどのように製品開発のプロセスに活かしますか?

「消費者視点からの製品開発セミナー」(2015/6/5開催)には、多くの方にご参加いただき、ありがとうございました。製品の官能的特徴に加え、消費者のもつイメージの調査の仕方、それらを複合的に解釈、まとめる手法についてフォーカスしたものでした。

さて、分析型のパネル、または消費者を用いて製品の評価をすることは、製品開発プロセスにおいて欠くことができないステップであるのは間違いないのですが、その頻度には限界があります。試験する人の問題(時間や感覚疲労)、それにコストの問題です。辛いものや苦いもの、あるいは臭いものをどれだけ継続的かつ客観的に評価できるでしょうか?

そこで、機器分析手法がスクリーニングに役立ちます。ヒトの知覚がいかに複雑に作用するかは、これまでのブログに書いてきました。機器分析(センサーなど)の単一データが、ひとつの属性を直接的に表現できるに越したことはないですが、単純な系では容易であったとしても、原料、プロセスが変わることで、その因果関係が常に維持されるとは限りません。

たとえば、水溶液中のショ糖濃度が増えれば、感覚的に甘さは増え、その結果は溶液の粘性値とも高い相関を示します。しかし、これは限定した系での単相関であり、外観やほかの特性が変化することで、解釈に誤解が生じます。

では、どのように機器分析データを使ったらよいか・・・。
多変量データによる相関です。サンプル選択の際は、競合品などを加えて、できるだけ差があるものを用意します。

記述型の官能評価や嗜好調査を行った15サンプルくらいが理想です。それによって、多感覚器分析システム(外観、香り、風味、食感・・・)による分析値と重回帰分析にて相関モデルが構築され、特定の評価用語に対してキーとなる化学成分、物性値の組み合わせも分かります。

どのような感覚がどのような分析値と相関があるか、また感覚の相互作用がどのようにあるかが、はっきりしない段階では、できるだけ多くのモダリティに関するデータを扱うことが大切です。

ひとつの属性Yを予測する回帰モデルであれば次のようになります。
ひとつの属性Yを予測する回帰モデル

たとえば、赤ワインの「苦味」を予測する重回帰分析を行うと、電子味覚システムの1つのセンサーの応答値、高速GCにより定量されたエタノール量、そして色(a値)がモデルに貢献していることが明確となります。

赤ワインの「苦味」を予測する重回帰分析

トライアル・アンド・エラーのプロセスにおける最終判断はヒトですが、それでも多くの試作品や開発品の中で、最適な解を得るために、機器分析をうまく使いこなしてみると、製品の開発スピードが上がり、開発フェーズの意思決定に役立ちます。

五感のイメージ

官能評価をどのように製品開発のプロセスに活かしますか?

これまで、数回にわたり記述分析法のプロセスの一部について書き込んできましたが、記述分析法だけに限らず、官能評価そのものは、企業における製品開発の重要なプロセスの一端を間違いなく担っています。

しかしながら、社内における官能評価の位置づけは、企業ごとに温度差があり、与えられる予算や人的なリソースの点で、決して恵まれているとはいえません。

もちろん製品開発の成功のカギは、価格や広告などあらゆる要素が絡み合うものではありますが、利益を生み出すための繰り返し購入には、製品そのものの品質(官能的差別化ポイント)が消費者の期待を満たすことが条件となるでしょう。

製品の官能的情報を得るためには、やはり官能評価が必要不可欠です。ただ、何をしたらよいか・・・そんな方のためにセミナーのご案内です。6月5日に、QDAの開発者Dr.Herbert Stoneが来日して、「消費者視点からの製品開発」セミナー(東京)を開催します。

製品開発の中で、官能評価をどのように活かすか、きっとヒントが見つかるかと思います。皆様の参加申し込みをお待ちしております!

20150605製品開発セミナーイメージ

QDA法(4)用語開発2

用語開発のつづきです。

ここまでで、食品がサンプルであれば、12名のパネル全体で最初は70〜100個くらいの用語が出てきます。似たような用語が出てきたら、パネル内でまとめるべきか、それとも別々に用いるべきか、相談してもらいます。

また、意味が分かりにくい用語が出てきたら、それを出したパネリストに説明してもらいます。ここで、それを示すリファレンスサンプルがあれば、出してもらうのも良いです。

ただし、リファレンスサンプルは、その感覚だけを呈するものではないので、いずれにしても正しく伝わらないかもしれません。あまりにリファレンスサンプルの提示にこだわり過ぎる必要はありません。

用語を整理して30個前後くらいまで絞ることができたら、パネル全体で各用語に解釈をつけます。これは、パネル内の認識を共通にする目的もありますし、次にパネルのメンバーが交代して、新しく参加する人がいたとしても、できるだけ用語を引き継いでもらいやすくするためです。

また、2つの異なる特徴のサンプルを提示して、それぞれの用語の強く感じる方を挙手してもらいます。その際、12名のうち全員が同じ片方のサンプルを強いと感じれば素晴らしいですが、たいていは、もう一方のサンプルを指す人が出てきます。そのとき、その用語が理解されていないか、またはそもそも差が少なかったか、違う感覚を示したパネリストに意見を求めます。

こうした繰り返しのワークを通じて、用語が揃ったら、スコアシート(ラインスケール)を作ります。評価する順に(食品であれば、見て、嗅いで、口にして・・・)用語を並べるようにします。これでQDAの準備はできました。

この用語開発のプロセスは、PLのファシリテーション能力が重要です。いかに、パネルから気分良く用語を出させるか、いつも決まった一人に発言させるのではなく、できるだけ全員からの発言を引き出すか・・・。そう、会社の会議の進行とまったく同じなんです!

ミーティング風景