O firmieOfertaPrawodawstwoAromatyKontaktNowościReceptury aplikacyjne  
 
 

AROMATY
ANALIZA SENSORYCZNA
 
Analiza sensoryczna

Cele
 
Czynnikiem najważniejszym w trakcie zarówno przygotowań jak i przeprowadzania testów sensorycznych jest jasne zrozumienie celu prowadzonych badań. Podczas gdy ten logiczny argument wydaje się oczywisty to jednak zbyt często nie jest on brany pod uwagę podczas przygotowywania testów sensorycznych, a przynajmniej nie w stopniu wystarczającym. Takie podejście prowadzi do niewłaściwych i mylących wniosków, pomijając już zmarnowany czas i energię. Określenie celów przeprowadzanego badania nie jest procesem czasochłonnym, wymaga jedynie odpowiedzi na następujące pytania :
 
- Jaka jest minimalna ilość informacji - danych sensorycznych pozwalająca na przejście do kolejnego etapu?
 
- W jakiej formie informacja ta powinna zostać podana?
 
- Jakie działania zostaną podjęte w oparciu o tę informację?
 
- Jakie inne testy (fizyczne, chemiczne, sensoryczne) zostały lub zostaną przeprowadzone?
 
- Jakie jest ryzyko - cena zebrania niedokładnych lub niewystarczających danych. Jaki poziom ryzyka (prawdopodobieństwo błędu typu I, typu II) jestdo przyjęcia?
 
Dodatkowo, co jest bardzo ważne, jeżeli wprowadzamy próbę kontrolną, należy ją dokładnie zdefiniować.
Wiele przeprowadzanych badań ma bardzo precyzyjnie zdefiniowane cele, jak np. w programach mających na celu powtórne otrzymanie istniejącego już produktu próbka testowa musi odpowiadać  konkretnemu produktowi, w granicach błędu statystycznego. Z kolei cele badań wymagające znacznych nakładów surowcowych wymagają zwykle również dodatkowego uściślenia i uzgodnień między klientem i dostawcą. Na przykład proste pytanie (kontrola jakości) „Czy ta próbka odpowiada próbie kontrolnej?" nasuwa inteligentnemu  naukowcowi następujące pytania :
 
- Co dokładnie oznacza próba kontrolna? Skąd się wzięła?
 
- Jak bardzo dana próbka musi być podobna by spełniała warunki odpowiedniości .
 
- Jakie jest akceptowane odstępstwo od normy w procesie produkcji?
 
- Jakie inne testy zostały przeprowadzone?
 
- Jakie działania zostaną podjęte w oparciu o te konkretne wyniki. Na jakie działania mają wpływ te konkretne wyniki?
 
Po jasnym sformułowaniu celów badań należy przejść do fazy przygotowania testów. Powinniśmy wybrać metody najlepsze  dla otrzymania żądanej informacji, biorąc pod uwagę koszty i ryzyko, które powinny być możliwie najmniejsze. Test sensoryczny należy konstruować z myślą o celu całego badania.  W zbyt wielu tego typu projektach rutynowo stosuje się metody ulubione lub „najlepsze", bez względu na każdorazowo konkretny cel. Do tej kategorii należą test trójkąta i test wewnętrzny. Czasami standardowa praktyka nie skutkuje osiągnięciem postawionych sobie celów, a badacz zmuszony jest zastosować inną metodę lub zupełnie nowe podejście, by rozwiązać postawiony przed nim problem.
 
Zastosowania testów sensorycznych
 
Specjalista z dużym doświadczeniem jest w stanie stworzyć własne, zupełnie nowe testy sensoryczne, jednak dla początkujących zasadne wydaje się być trzymanie się utartych szlaków, ze względu na prawidłowość i wiarygodność otrzymywanych wyników. Poniżej opisano niektóre z zastosowań testów sensorycznych w przemyśle spożywczym. Konkretne metody znajdują się w części II (Section II).
 
Tworzenie nowego produktu - niestety, wiele nowych produktów to tak naprawdę imitacje i wariacje na temat istniejących, ustalonych standardów. Test sensoryczny potwierdzi tu, że produkt odpowiada określonemu standardowi lub że uzyskano "punkt zróżnicowania". Metodą preferowaną będzie analiza opisowa. Test afektywny (subiektywny) określi, czy spełnione są wymogi akceptowalności. Zauważmy, że chociaż taco i pomarańcza smakują zupełnie inaczej, to jednak mogą charakteryzować się podobnym poziomem akceptowalności (mogą być tak samo dobrze lub źle odbierane przez konsumentów).
 
Zestawienie produktu - celem jest stwierdzenie, że nie ma wyczuwalnej różnicy między produktem standardowym i testowanym. Do tej kategorii należy większość projektów mających na celu obniżenie kosztów produkcji lub zastąpienie jednego składnika innym. Zastosowanie znajdą tu analityczne testy różnicowe, takie jak trójkąt i duo-trio.
 
Ulepszenie produktu - aby przekonać się czy produkt faktycznie jest lepszy stosujemy testy afektywne, dzięki którym stwierdza się, czy otrzymana próba jest w odczuciu klientów rzeczywiście „lepsza" od próby kontrolnej.
 
Zmiana procesu produkcyjnego - jakość produktu powinna być taka sama bądź lepsza. Kolejność testów jest logiczna :
 
  1. testy analityczne (różnicowe i/lub opisowe) w celu określenia czy produkt
  2.      testowany różni się od kontrolnego ( jeśli się nie różni, nie może być lepszy)
  3. testy afektywne, jeśli produkty się różnią, w celu stwierdzenia czy
     produkt testowany jest lubiany/podoba się bardziej czy tak   samo jak próba
    kontrolna.
 
Obniżenie kosztów i /lub wybór nowego dostawcy  - udany projekt obniżenia kosztów oparty na tańszych składnikach, tańszej produkcji lub przeniesieniu produkcji w inne miejsce zakłada, że jakość produktu finalnego będzie porównywalna z wcześniej ustalonym standardem lub produktem kontrolnym. To samo dotyczy zmiany dostawcy surowców. W takiej sytuacji mamy pole do popisu dla testów analitycznych.
 
Kontrola jakości - Aby zapewnić zakładaną jakość produktu testy analityczne przeprowadza się w trakcie produkcji, dystrybucji i działań marketingowych. Próbki są oceniane następująco :
 
  1. testy różnicowe w celu określenia czy próbka różni się od standardu/normy (jeśli nie to musi być tak samo dobra)
  2. testy opisowe, jeśli próbka jest różna, w celu określenia tejże różnicy. Wyniki pomogą usunąć różnicę niepożądaną, poprzez np. modyfikację procesu produkcji. Niewielkie zespoły oceniające osiągają na tym polu bardzo dobre wyniki.
 
Trwałość / stabilność produktu w okresie przechowywania - testy analityczne oceniają stabilność produktu w trakcie transportu, magazynowania, przechowywania w warunkach domowych. W celu uzyskania informacji o trwałości produktu, otrzymuje się reprezentatywne próbki, które zostają wstępnie ocenione, a następnie przechowywane są w określonych warunkach, cały czas pod kontrolą. W określonych odstępach czasowych próbki są ponownie oceniane, zwykle polega to na porównaniu z próbą kontrolną. Próba kontrolna musi pochodzić z tej samej partii towaru i przechowywana być w warunkach, o których wiadomo, że nie zmienią jej jakości, np. w lodówce lub zamrażarce. Testy analityczne przeprowadzane w celu określenia stabilności produktu w czasie jego przechowywania mogą zawierać:
 
  1. testy różnicowe w celu określenia czy próbki różnią się od próby kontrolnej (jeśli nie występuje znacząca różnica zakłada się stabilność produktu)
  2. testy opisowe, wyłączne lub w połączeniu z testami różnicowymi w celu scharakteryzowania jakościowo i ilościowo występujących zmian. Analiza opisowa stosowana jest często w sytuacjach gdy utrzymanie próby kontrolnej jest nierealistyczne.
  3. testy afektywne można stosować w celu określenia akceptacji względnej (odbioru przez klientów) przechowywanych produktów.
 
METODY
 
Przed przygotowaniem jakiegokolwiek testu sensorycznego należy zapoznać się z wszystkimi standardowymi metodami, ich plusami i minusami. Można je podzielić na analityczne i afektywne, i zdefiniować następująco :
 
TESTY ANALITYCZNE: wymagają zastosowania  metod, które pozwolą na uzyskanie charakterystyki / opisu właściwości żywności. Testy analityczne odpowiadają na pytania takie jak: która próbka jest bardziej słona? która próbka jest inna? czy próbka jest bardziej opiekana, pieczona czy spalona? Metody analityczne definiują właściwości organoleptyczne jedzenia ale nie pozwalają bezpośrednio przewidzieć  czy próbka będzie smakowała i jak bardzo. Testy analityczne zawierają:
 
  1. Testy różnicowe: trójkąt, duo-trio, porównawcze w parze i wielokrotne, wskaźnik ważkości.
  2. Analiza opisowa (charakterystyka aromatyczna/ smakowo-zapachowa, analiza
  3.     opisowa ilościowa, spektrum).
  4. Ranking - szeregowanie (nie wg preferencji).
  5. Ocena jakości: przy bardzo jasno sprecyzowanym znaczeniu słowa „jakość".
 
TESTY AFEKTYWNE: wymagają udziału nieekspertów, osób nie przeszkolonych, które biorą udział w testach takich jak wyrażanie opinii / zdania, akceptacji, preferencji; testach subiektywnych. Ideałem są faktyczni konsumenci danego produktu, jednak jest to bardzo kosztowna procedura. Testy te można wykonać w domu osoby nie przeszkolonej i nie będącej członkiem żadnego zespołu oceniającego. Przykładowe pytania to: którą próbkę wolisz? jak bardzo ci smakuje? co konkretnie Ci nie smakuje?
 
 
 
Testy analityczne
 
Testy różnicowe odpowiadają na pytanie czy próbki są różne. Nie definiują ani jak ani jak bardzo się różnią. Zaliczymy do nich tak popularny test trójkąta, duo-trio, test porównawczy w parze, wielokrotny i wskaźnik ważkości (r). Testy te można przeprowadzać udziałem ekspertów lub bez nich. Ogólnie przyjmuje się, że jeżeli zespół ekspertów nie jest w stanie określić znaczącej różnicy między produktami, faktyczni konsumenci (którzy nie są tak wrażliwi) również nie będą w stanie tego zrobić. Jednak to niekoniecznie musi być prawdą, jeśli wziąć pod uwagę długotrwałe stosownie danego produktu w warunkach domowych.  Testy różnicowe powinny być przeprowadzane z udziałem przynajmniej 30 osób, a najlepiej jeżeli ich liczba bliższa jest 50 lub 60. Większa liczba sędziów obniża ryzyko ß - ryzyko, że dwie próbki zostaną uznane za takie same podczas gdy w rzeczywistości różnią się. W większości przypadków chodzi o to, by zachować charakterystykę sensoryczną produktu zmieniając jednocześnie niektóre składniki, proces produkcyjny itp. Dlatego faktycznie celem jest stwierdzenie, że próbki są identyczne. Niestety testy różnicowe zaprojektowano by stwierdzić różnice, nie podobieństwa. Wartości prawdopodobieństwa α przedstawiane w standardowych tabelach przedstawiają ryzyko związane ze stwierdzeniem, że próbki są różne podczas gdy w rzeczywistości są takie same. Tego typu ryzyko jest w przemyśle spożywczym bez znaczenia. Ważne natomiast jest ryzyko β , dlatego lepiej gdy oceniających jest więcej (50-60), lub gdy w skład zespołu wchodzą ludzie o wyższej niż średnia zdolności wyczuwania różnic (wrażliwość sensoryczna). Wartości prawdopodobieństwa β  można obliczyć używając wzoru przedstawionego w Opracowaniu Amerinego, Pangborna i Roesslera (1965). Inne dane na ten temat można znaleźć w pracach Stone'a i Sidela (1985) i Meilgaarda i in. (1987). W tych ostatnich opisano  metodologię testów podobieństwa w kontekście testów różnicowych.
 
 
Test trójkąta
 
Prawdopodobnie jeden z najpopularniejszych i najczęściej stosowanych testów laboratoryjnych.  Osoba oceniająca otrzymuje dwie identyczne próbki z (tej samej partii) oraz trzecią, która jest od nich różna. Celem testu jest stwierdzenie, która próba jest inna. Dodatkowo osoba testująca proszona jest o określenie na czym polega różnica. Opublikowane tabele (Roessler i in. 1978) dostępne w różnych opracowaniach na temat analizy sensorycznej określają wymaganą liczbę właściwych identyfikacji będącą wskaźnikiem różnicy statystycznie znaczącej.
 
Jeżeli trzy próbki nie różnią się od siebie, wyłącznie przypadkowo istnieje jedna na trzy, możliwość zidentyfikowania próbki różniącej się (innej). Dlatego w przypadku zespołu składającego się z  30 osób, oczekuje się, że przynajmniej 10 wyników właściwych będzie wyłącznie rezultatem przypadku.
Aby poziom ufności wynosił 95%, należałoby otrzymać 15 prawidłowych wyników. Nie ma nic znaczącego w poziomie 95% (α = 0,05), chociaż ciągle jest on podstawą do podejmowania decyzji  dla wielu badających.  Zaleca się kalkulację, lub posłużenie się tabelami Roesslera (1978) w celu ustalenia dokładnego prawdopodobieństwa wyników a następnie podjęcie odpowiedniej decyzji produkcyjnej, np. jeżeli z 36 osób 17 prawidłowo rozpoznało różniącą się próbkę, prawdopodobieństwo, że był to wynik przypadku wynosi α = 0,058 (próbki są różne na poziomie 94,2% - poziom ufności).  Jeżeli poziom ufności 95% stanowi punkt graniczny, próbki zostaną uznane za odpowiednie a produkt wysłany do klienta.  Jeżeli jest to ważny klient to czy takie próbki testowe powinny zostać wysłane? Przy jakim poziomie ufności próbki nie powinny zostać wysłane? Każda taka decyzja, jak każda sytuacja, jest inna i dlatego wymaga dokładnego zaplanowania zarówno celów testu jak i działań podejmowanych na podstawie wyników otrzymanych po ich przeprowadzeniu.
 
Wykazano, że kolejność w jakiej próbki są oceniane wpływa na wyniki. Zauważa się tendencję wskazywania próbki środkowej jako różnej. Aby temu zapobiec zaleca się zastosowanie wszystkich sześciu możliwych kombinacji i prezentowanie ich losowo lub w pewnym określonym porządku. Np. w teście, którego celem było określenie, czy imitacja ekstraktu wiśniowego różni się od samego ekstraktu proponuje się następującą kolejność :
 
 
Osoba 1 Ekstrakt ekstrakt imitacja
Osoba 2 imitacja ekstrakt ekstrakt
Osoba 3 ekstrakt imitacja ekstrakt
Osoba 4 imitacja ekstrakt imitacja
Osoba 5 imitacja imitacja ekstrakt
Osoba 6 ekstrakt imitacja imitacja
 
 
Każda kombinacja powinna mieć nadany swój numer i zostać rozlosowana przez osoby oceniające. Minimalnie w teście powinno wziąć udział 36 osób. Jeżeli trudno jest znaleźć taką ilość osób odpowiadającą kryteriom, test można przeprowadzić dwukrotnie z 18 osobami. Im bardziej doświadczone są osoby testujące tym większe prawdopodobieństwo stwierdzenia (wyczucia) różnicy.
 
Warunki przeprowadzania testu trójkąta należy ściśle kontrolować. Wszystkie różnice pomiędzy próbkami, oprócz aspektu sprawdzanego, muszą zostać wyeliminowane lub zamaskowane, aby wykluczyć błąd.  Przy podejmowaniu decyzji oceniający szybko uczą się wykorzystywać wszelkie możliwe wskazówki. Dlatego wszelkie zmienne takie jak temperatura czy konsystencja należy ściśle kontrolować.
 
Zalety testu trójkąta: 1) krótki czas przeprowadzenia, 2) cel zrozumiały dla oceniających, 3) natychmiastowa analiza danych, 4) test jest jasny i zrozumiały oraz powszechnie stosowany.
Wady testu: 1) tylko dwie próby (testowa i kontrolna), 3 próby wysoko aromatyzowanego produktu mogą  być nieco przytłaczające, 3) brak wskazówki / kierunku w jaki sposób próbki różnią się.
 
Ukierunkowany test trójkąta
 
Jest to modyfikacja testu klasycznego, która w pewnych przypadkach charakteryzuje się większą skutecznością. Na przykład gdy pojawia się nowy aromat czekolady, a jego cena jest znacznie niższa, ukierunkowany test trójkąta pozwoli sprawdzić czy jest on silniejszy czy słabszy. Oceniający  proszony jest o zidentyfikowanie próby różniącej się oraz określenie, która próba (para czy pojedyncza) jest silniejsza w ramach wcześniej zdefiniowanej charakterystyki (aromat czekolady).
 
Do analizy służą dane pochodzące od osób, które właściwie wskazały próbkę różną. Prawdopodobieństwo przypadku  wynosi 1/6  ( 1/3 x 1/2 ).
 
Test duo-trio
 
Jest to kolejny test różnicowy z trzema próbkami. Najpierw oceniający dostaje zakodowaną próbę „kontrolną" lub „wzorcową", którą ocenia.  Następnie próbka ta może ale nie musi zostać usunięta, a oceniający dostaje dwie nieznane, zakodowane próbki w kolejności losowej, bądź wcześniej ustalonej. Oceniający ma odpowiedzieć, która z dwóch nowych próbek jest identyczna z próbą kontrolną. Mimo, że test duo-trio stosuje 3 próbki, wyniki analizowane są przy użyciu tablic porównawczych dla par, gdyż prawdopodobieństwo odgadnięcia właściwej odpowiedzi wynosi tu 50%.
 
Jeżeli próbka kontrolna zostaje usunięta, test przypomina bardziej rzeczywistą decyzję „konsumenta", ponieważ w rzeczywistości konsumenci nie mają próbki kontrolnej, z która mogliby porównać nowy produkt. Dostępną mają jedynie swoją pamięć. W przypadku usunięcia próbki wzorcowej test duo-trio przypomina taką właśnie sytuację.
 
Test ten można stosować jako formę selekcji i szkolenia osób oceniających. W trakcie szkoleń należy pamiętać, że osoby testujące powinny być informowane na bieżąco o swoich wynikach. Nawet jeśli podają błędne odpowiedzi, praktyka pomaga nauczyć ich rózróżniania, szczególnie jeżeli mogą kosztować kilka razy i starają się rozpoznać kombinacje identyczne.
 
 
Porównanie w parach / par
 
Polega na porównaniu dwóch próbek. W prostszej wersji tego rodzaju testu oceniający otrzymuje dwie próbki i jego zadaniem jest stwierdzenie czy jest między mini jakaś różnica. W teście ukierunkowanym  należy odpowiedzieć na pytanie, która z przedstawionych próbek jest mocniejsza, przy czym określa się tu intensywność jednej, dokładnie zdefiniowanej cechy (np. preferencja osobista, słoność, twardość, itp.) W obydwu wersjach próbki mogą być prezentowane równocześnie lub sukcesywnie.
 
Proste porównanie dwóch próbek polega na przedstawieniu dwóch próbek w układzie AA, AB, BA lub BB. Odpowiedź może brzmieć albo „jest różnica" albo „nie ma różnicy". Szczególnie duże znaczenie ma tutaj właściwe przeprowadzenie tego testu. Oceniający muszą zostać poinformowani o prawdopodobieństwie otrzymania próbek identycznych lub różnych.  Nie mogą zakładać, że próbki są różne (tylko kombinacje AB i BA); muszą zostać poinformowani o wszystkich czterech możliwych kombinacjach. Analiza wyników polega na zliczeniu liczby właściwych odpowiedzi i zastosowaniu odpowiednich tabel porównawczych.
 
 
Porównanie par ukierunkowane jest najczęściej stosowanym testem porównawczym. Próbki mogą być prezentowane w dwóch możliwych kolejnościach AB i BA. Oceniający ma określić, w której próbce  bardzo dokładnie zdefiniowana wcześniej cecha jest intensywniejsza. Niezbyt fortunnie jest pytać nie przeszkolonego oceniającego  „która próbka ma bardziej eugenolowy charakter?" czy też „która próbka ma charakter bardziej  terpenowy?", ponieważ albo osoba ta nie będzie wiedziała co oznaczają terminy eugenolowy i terpenowy albo zrozumie je w niewłaściwy sposób.  Będziemy wtedy mierzyć różnice odczuwane jednak bliżej nie zdefiniowane.
 
Błąd położenia jest czynnikiem znaczącym w testach porównawczych par dlatego kolejność prezentowania próbek musi być zrównoważona, co oznacza, że tyle samo próbek przedstawia się w kolejności AB co w odwrotnej.
 
Wyniki analizuje się przy użyciu tablic porównawczych dla par (Roessler i in. 1978). Jedna z tabel  ma zastosowanie dla testu z jedną właściwą odpowiedzią, druga gdy dwie odpowiedzi są możliwe.  Interpretacja statystyczna różnicy między tymi testami jest dość złożona. W jednej wersji tego testu możliwe są dwie odpowiedzi: albo A albo B. W drugiej natomiast wiadomo, która z próbek  jest intensywniejsza i sprawdza się wrażliwość oceniających. Ten typ testu stosuje się w celu stwierdzenia czy rzeczywiście istnieje znacząca różnica, dotyczą go również niższe limity. Test duo-trio jest testem porównawczym z jedną właściwą odpowiedzią.
Test porównawczy wielokrotny
 
Próbka standardowa zostaje oznaczona jako taka („kontrolna" lub „wzorcowa") i przedstawiona oceniającemu wraz z zakodowanymi  próbami testowymi (blind test samples). Oceniający ma porównać każdą z próbek ze znaną próbą  kontrolną  pod względem jednej, zdefiniowanej cechy. W teście tym bardzo skutecznie można ocenić cztery lub pięć próbek jednocześnie, ale tylko pod względem jednej, może dwóch cech. Możliwe jest uchwycenie bardzo niewielkich różnic, da się również zmierzyć kierunek i rząd wielkości danej różnicy. Wyniki analizowane są w systemie ANOVA (Larmond 1977, Meilgaard, Civille i Carr 1987).
 
Wskaźnik ważkości
 
Wykorzystanie teorii detekcji sygnału w sensorycznych testach różnicowych została opisana przez O'Mahoney'a (1983, 1986, 1988). Praktycznie chodzi o wyliczenie „wskaźnika r", który jest miarą wrażliwości sensorycznej, czyli możliwości wyczuwania różnic między próbkami. Jest to miernik prawdopodobieństwa, że oceniający potrafi odróżnić nowy sygnał sensoryczny (próba testowa) od tła (próba kontrolna). Uważa się również, że wskaźnik ten jest miarą różnicy między dwoma produktami (O'Mahoney 1983). Wskaźnik ważkości określa się w skali 50-100, 100 oznacza różnicę zauważalną w 100%, 50 - różnicę w ogóle nieodczuwalną.
 
Im wyższa wartość wskaźnika r tym większa różnica między dwoma próbkami. Jedną z zalet tego rodzaju testu jest możliwość porównania próby kontrolnej z kilkoma innymi w ramach jednego testu, przeprowadzonego w bardzo krótkim czasie. Nie ma tu ograniczenia, jakim jest prosty wzorzec dwupróbkowy. Wadą natomiast jest fakt, że skala tego testu nie jest ogólnie tak dobrze rozumiana (rozpoznawana) jak wartości prawdopodobieństwa α. Znaczenie różnicy pomiędzy wartościami wskaźnika r wynoszącymi 0,7 i 0,8 nie jest jasne. Równie trudno określić jak należy podejmować konkretne decyzje produkcyjne w oparciu o taki test. Samo wyliczenie wskaźnika na podstawie danych testowych nie stanowi problemu, nie istnieją natomiast tabele, przy pomocy których można by otrzymane wyniki zinterpretować, określając tym samym ich znaczenie statystyczne.
 
PRODUKT: COLA
NAZWISKO :
DATA          :
 
  1. Zapoznaj się z próbą kontrolną (C)
  2. Odłóż próbę kontrolną i poczekaj na następne.
  3. Oceniaj próby od lewej do prawej odpowiadając na następujące pytania.
(Zaznacz tylko jeden punkt dla każdej próbki)
 
 
Próba LZ ___ Jestem pewny, że jest to próba kontrolna
___ Nie jestem pewny ale sądzę, że jest to próba kontrolna
___ Nie jestem pewny ale sądzę, że to nie jest próba kontrolna
___ Jestem pewny, że  to nie jest próba kontrolna
 
Próba NP. ___ Jestem pewny, że jest to próba kontrolna
___ Nie jestem pewny ale sądzę, że jest to próba kontrolna
___ Nie jestem pewny ale sądzę, że to nie jest próba kontrolna
___ Jestem pewny, że  to nie jest próba kontrolna
 
Próba QR ___ Jestem pewny, że jest to próba kontrolna
___ Nie jestem pewny ale sądzę, że jest to próba kontrolna
___ Nie jestem pewny ale sądzę, że to nie jest próba kontrolna
___ Jestem pewny, że  to nie jest próba kontrolna
 
Rys. 20-1.  Przykładowy formularz testowy
 
 
W celu przeprowadzenia testu oceniający musi zapoznać się z próba kontrolną (którą określa się jako "szum" "hałas" (tła) lub "n"), która może zostać następnie usunięta lub nie, po czym zapoznaje się z jednym lub większą ilością zakodowanych "sygnałów" (próby testowe) i zakodowanym duplikatem próby testowej. Oceniający pytany jest czy jest pewny, że dana próba jest taka sama jak próba kontrolna, czy  sądzi, ale nie jest pewny, że ta próba jest taka sama jak kontrolna, czy sądzi ale nie jest pewny, że ta próba nie jest taka sama jak kontrolna i czy jest pewny, że dana próba różni się od kontrolnej. Rysunek 20-1 przedstawia przykładowy kwestionariusz wypełniany podczas takiego testu.
 
Wzór, według którego oblicza się wskaźnik r znajduje się w Tabeli 20-1.
 
W teście, w którym 10 oceniających zapoznało się z próbą kontrolną („szum") i zakodowanymi próbą kontrolną (N) i testową (S) otrzymano wyniki przedstawione w Tabeli 20-2.
 
 
Tabela 20-1.
 
S-pewny   nie-S-pewny nie-N-pewny  N-pewny
Sygnał = S      a              b                  c                  d   nS=a+b+c+d
Próba ____________________________________________
Szum =  N      e              f                   g                  h   nN=e+f+g+h        
                                    
r =  a (f+g+h) + b(g+h) + ch + ˝(ae + bf + cg +dh)
(nS) (NN)
Tabela 20-2
S    S?      N?    N
__________________________________________
Próba S 6 2 2    nS = 10
__________________________________________
N 1 2 7  nN = 10
r =  60 + 18 + 14 + ˝ (2+ 4)  =  0,95
         10 x 10
 
Ponieważ wartość wskaźnika jest tak bliska 1,0 należy uznać, że próby są różne. Ale jak różne? Być może różnica między nimi jest większa niż różnica między inną próbą testową o wskaźniku r  równym 0,70.  Testujący musi najpierw wykalibrować skalę indeksu r. wykorzystując do tego znane sobie różnice między produktami. Wtedy dopiero wskaźnik r będzie miał zastosowanie praktyczne.
 
 
Analiza opisowa
 
Technika ta zastosowana w ocenie sensorycznej produktu identyfikuje, opisuje i kwantyfikuje jego właściwości sensoryczne (wizualne, dotykowe, słuchowe, węchowe i smakowe). Konieczny jest zespół oceniający składający się z od 5 do 10 przeszkolonych w tym celu osób, które doskonale znają charakterystykę sensoryczną produktu i potrafią dokładnie i precyzyjnie przekazać swoje odczucia. Istnieje wiele często stosowanych form analizy opisowej, np. metoda „charakterystyki aromatu" opracowanych przez Arthur D. Little Inc. (Caul 1957), „ilościowa analiza opisowa". Metoda Tragon Corporation (Stone i in. 1974, i Zook i Pearce 1988) a także „Spektrum", metoda  Sensory Spectrum (Meilgaard, Civille i Carr 1987). Wiele firm opracowuje własne metody analizy opisowej, przy czym większość z nich uzyskuje ten sam rodzaj informacji.
 
Jeżeli dane otrzymuje się stosując skale (lub wagi?) interwałowe (stosunkowe), do analizy statystycznej stosuje się  popularne metody statystyczne takie jak test t (studenta) i analizę wariancyjną. Dane prezentowane są graficznie w różnych formach, od wykresu słupkowego do pierścieniowego. Ten ostatni daje natychmiastowy obraz jak smakuje dany produkt i dlatego dobrze przekazuje wyniki otrzymane przez zespół oceniający. Żeby właściwie zinterpretować taki wykres należy pamiętać, że punkt centralny ma wartość „0" na wszystkich  skalach opisowych, a im dalej od środka położony dany punkt,  tym większa  jego wartość.  Rysunek 20-2 przedstawia różnice między dwoma ekstraktami Bourbon Vanilla (Madagaskar i Kamaran) oraz ekstraktem indonezyjskim. Jak widać na wykresie ekstrakt indonezyjski nie pachnie ani nie smakuje tak samo jak ekstrakty z Kamaranu czy Madagaskaru (Bourbon), jest on znacznie mocniejszy jeśli chodzi o nutę wędzoną/dymową, słabszy jeśli chodzi o nutę suszonej śliwki, wanilii oraz ogólnego wyczucia smaku waniliowego.
 
 
ZAPACH ŻYWICY ZAPACH BURBONA
ZAPACH SUSZONEJ ZAPACH WANILII
ŚLIWKI *
 
 
ZAPACH DYMU*
ZAPACH DREWNA
OGÓLNE WRAŻENIE
ZAPACHOWE OGÓLNE WRAŻENIE SMAKOWE
 
SMAK DREWNA NUTA WANILII
 
SMAK WANILII** SMAK DYMU**
 
SMAK ŻYWICY SMAK SUSZONEJ ŚLIWKI
 
 
  • *Różnice znaczące statystycznie przy poziomie 95%
  • **Różnice znaczące statystycznie przy poziomie 99%
 
______   KAMARAN _ _ _   INDONEZJA .............   MADAGASKAR
 
Rysunek 20-2. Wykres ilustrujący różnice sensoryczne miedzy ekstraktami wanilii z różnych regionów świata.
 
Należy zaznaczyć, że nie wszystkie różnice w charakterystyce sensorycznej są znaczące statystycznie (tzn. zapach i smak), że względna ważność każdej cechy może być inna. Na przykład statystycznie znacząca różnica dotycząca nuty śliwkowej zostanie uznana za mniej ważną od różnicy w intensywności waniliowego aromatu tego produktu.
 
Analiza opisowa najczęściej stosowana jest w procesie tworzenia nowego lub ulepszania istniejącego produktu, jak również w celu określenia problemów związanych z jego przechowywaniem. Tego rodzaju test jest pomocny w poznaniu właściwości sensorycznych, nie jest jednak testem właściwym w przypadku oceny akceptowalności (odbioru) produktu i preferencji.  Analiza opisowa najlepiej sprawdza się w połączeniu z testem afektywnym, wyjaśniając jego wyniki.
 
Obecnie w analizie opisowej stosuje się głównie jakiś rodzaj skali liniowej. Może być ona zakotwiczona (?) na końcach (zero albo ekstremum), w środku, lub w kilku punktach na skali. Oceniający muszą podawać swoje oceny według tych punktów. Wszystkie terminy używane w trakcie testu powinny zostać zilustrowane werbalnie lub fizycznie, jak w Tabeli 20-3 i w opracowaniu Meilgaarda, Civille'a  i Carra (1987).
 
Tabela 20-3.  Czarny pieprz
 
 
Termin analizy opisowej Odnośnik fizyczny Definicja słowna
 
 
Nuta drewna B-caryophelene przy 100ppm trociny
Nuta stęchlizny borneol przy 100 ppm wilgotna piwnica
Nuta terpenowa felandren przy 500 ppm cytrusy
Nuta gorąca f-piperyna przy 30 ppm palący/ostry
Nuta kwiatowa olej balsamowy przy 500 ppm kwiatowo-słodki
Nuta mydlana mydło „saddle"(?)    mydlany
 
Gdy stosuje się odnośniki fizyczne a nie tylko definicje, łatwiej jest przeprowadzić ten sam test z innym zespołem oceniającym. Same definicje słowne nie są wystarczające, żeby to zrobić. Interpretacja danych zespołu oceniającego może zostać przeprowadzona wyłącznie metodami statystycznymi, jeśli  wypełnione formularze zawierają opis wszystkich możliwych cech a ilość osób i powtórzeń dla każdej  próbki jest wystarczająca, ogólnie 10 - 18 osób i 2 do 3 powtórzeń.  Inne podejścia opierają się nie tylko na wynikach statystycznych ale również na rozmowie oceniających następującej po każdym teście. Zaletą (a czasem ryzykiem) takiej dyskusji jest fakt, że oceniający mogą się sporo nauczyć, szczególnie gdy pojawiają się niezwykłe lub nieoczekiwane nuty aromatyczne.
 
Oceniających rekrutuje się zarówno wewnętrznie jak i z zewnątrz. Szkolenie zajmuje od 6 do 10 godzin dla danego produktu. Zaletą zatrudnienia pracowników tymczasowych, w niepełnym wymiarze jest elastyczność jaką taka sytuacja daje prowadzącemu badania, która przeważa nawet obawy dotyczące  pewności wyników. Z kolei wykorzystanie stałych pracowników wiąże się z innymi korzyściami, a mianowicie oszczędnością czasową i finansową czy  lepszym zrozumieniem zagadnień i terminów związanych z aromatami.
 
Ranking - szeregowanie
 
Metoda rankingu jest bardzo prosta, zrozumiała i nie zajmuje dużo czasu. Stosowana w celu  określenia różnicy między kilkoma próbkami, przy czym różnica dotyczy  jednej cechy (np. słodkość, mięsność itd.). Zakodowane próbki (wśród których może znajdować się próbka kontrolna) przedstawiane są jednocześnie oceniającemu, który proszony jest o ustawienie ich kolejno w zależności od intensywności testowanej cechy. Szczególnie ważne jest tutaj zrozumienie przez oceniających znaczenia badanej właściwości, nie może być w tej kwestii żadnych niejasności. Jeśli zachodzi potrzeba, na tych samych próbkach można zbadać więcej niż jedną cechę. W takim przypadku, najpierw ocenia się np. słodkość, potem koduje próbki jeszcze raz i ocenia się słoność produktu. Próbki powinny być prezentowane w kolejności losowej.
 
Analiza wyników w tym przypadku jest uproszczona dzięki zastosowaniu gotowych tablic (Newell i MacFarlane 1987), pod warunkiem, że ilość próbek jest mniejsza niż 13 a liczba oceniających nie przekracza 100 osób.
 
Na przykład Tabela 20-4 przedstawia wyniki dla czterech próbek wina, których słodkość oceniana była przez pięciu oceniających.
 
Tabela 20-4
 
 
Oceniający Próbka A Próbka B Próbka C Próbka D
 
1        1      2      3      4
2        2      1      4      3
3        2                    1                      3      4
4        1                    3      2      4
5        1      2      4      3
 
Suma        7      9      16      18
 
 
Korzystając z tabeli różnicy sum w celu porównania „wszystkich ocen" (α = 0,05)  znajdujemy wartość „11", która jest minimalną różnicą między dwoma sumami pozwalającą stwierdzić, że próbki różnią się między sobą (α = 0,05).
 
Tak więc, jeżeli różnica między którymikolwiek sumami w Tabeli 20-4 jest większa niż 11, oznacza to, że dane dwie próbki są różne. Jako że sumy dla próbek A i D wynoszą odpowiednio 7 i 18, mamy 95% prawdopodobieństwa, że jedna z nich jest słodsza od drugiej. Żadna inna para nie spełnia tego warunku.  Newell i Farlane (1987) opublikowali również tabele dla porównania w podobny sposób „próby testowej kontra wzorcowa". Dane testu rankingowego można również analizować metodą Fishera i Yatesa (Larmond 1977) lub wykorzystując test Friedmana (Meilgaard 1987).