4-10 Chinese Box

Charlie var lige en tand for filosofisk efter min smag idag! Han nævnte elevatorparadokset, Turing test, det kinesiske værelse (eller den kinesiske æske?), Cluster analyse, Invers geometri og (igen) noget spilteori (chomp). Der var en hel del matematik i anvendelse f.eks. bag “varmesignaturbillederne”, men det blev ikke bragt op.
Cluster analyse
I denne sammenhæng drejede det sig om at skille “varmebilledet” af David fra det af hans kidnapper, Blakely. Illustrationen var en fiskestime, hvor man skulle skille en slags fisk fra en anden, og på Mathworld mener de, algoritmen er “fuzzy c-means”.
Cluster analyse optræder i mange sammenhænge og mange variationer. Overordnet drejer det sig om at dele sine data op i ensartede grupper – samle de fisk, der har røde striber i en gruppe og dem med grønne striber i en anden – og data i forskellige grupper skal ikke ligne hinanden for meget. Det skal gøres af en computer; så man ønsker en algoritme, der kan gøre det. Og den skal selv kunne finde ud af, at det faktisk er grønne og røde striber, der er karakteristisk.
Hvert datapunkt har en vektor af karakteristika: (x1,x2,x3,x4,…,x17). Det kan være placering i rummet, farve, striber, volumen,… Og man har et afstandsmål – fra en fisk med to grønne og to røde striber til en med en grøn og tre røde er der måske lige så langt som fra “tre grønne og en rød” til “to grønne og to røde”. Og det afhænger nok af rækkefølgen af striberne. Den samlede afstand tager alle koordinaterne med i betragtning.
I Fuzzy c-means algoritmen (FCM), kan et datapunkt tilhøre flere grupper (en fisk har måske grønne og røde striber) og “fuzzy” elementet ligger desuden i, at det kan tilhøre den ene gruppe mere end den anden – måske er der kun en enkelt grøn stribe, men mange røde.
Har man kun en koordinat (f.eks.antallet af striber ), kan man repræsentere data på en linie, og grupperingerne handler om, at man kan samle dem i “klumper” efter, om de ligger tæt på hinanden.

Figuren, som er fra den applet, jeg henviser til nedenfor, viser 20 punkter delt i 3 grupper. De fede lodrette linier indikerer centret i hver af grupperne, og punkterne er farvet efter, hvilken gruppe, de hører mest til. Kurverne med hhv. grønt, blåt og magenta areal, er en beskrivelse af i hvor høj grad, et punkt ligger i den ene eller den anden gruppe. Bemærk, at den samlede vægt for hvert punkt er et fast tal. Man kan f.eks. have vægt 1 blå eller (1/4 grøn +1/4 magenta+1/2 blå), men altid ialt 1.

Der er en applet, man kan lege med, her. Man kan vælge antal punkter, antal grupper (clusters), fuzzyness, som er noget med, hvor vægelsindet man kan være – hvor meget kan et punkt tillades at høre til flere grupper Hvis fuzzyness er 1, kan hvert punkt kun ligge i en gruppe. For voksende fuzzyness kan de være i flere og flere. Desuden vælges en nøjagtighed, som siger, hvornår algorimen skal stoppe.

Algoritmen skal optimere en funktion, som måler hvor god en gruppering, vi har. Altså hvor meget elementer i samme grupper ligner hinanden, og hvor meget elementer, der ikke er i gruppe, afviger fra hinanden.

Fuzzy c-means bruges i mønstergenkendelse, i billedanalyse – det kan være medicinsk: hvad er blodkar og hvad er muskelvæv, i marketing: klassificer forbruger efter adfærd, i analyse af forsikringskunder med høj risiko/lav risiko. I bioinformatik til klassifikation af gener Og sikkert meget mere.

Om det kan bruges til det, Charlie ville, ved jeg ikke. Men det er da billedanalyse, så mon ikke.

Chomp
Chomp er et spil for to. Man har et rektangel, af en eller anden grund tænker man her på en plade chokolade, med n felter på den ene led og m på den anden. Det øverste venstre hjørne erklæres “giftigt”. Man kan brække stykker af ved at tage et felt og alt, hvad der ligger nedenfor og til højre for dette.Den, der tager det giftige stykke har tabt.
Eksempel:

Billeder fra Cornell’s side om Numb3rs

Man kan spille det her.
Man kan vise, at den, der starter, altid kan vinde. Men man kan ikke give en generel vindende strategi.
Turing test og kinesisk værelse
Man diskuterer, om det er muligt at skabe kunstig intelligens, og hvordan man ville kunne se, at man havde en intelligent computer. Turing testen (beskrevet af Alan Turing i 1950 i artiklen Computing Machinery and Intelligence) drejer sig om, at en “dommer” “konverserer” (skriver spørgsmål til ) computeren og et menneske og ikke udfra svarene kan se, hvem der er mennesket.
Endnu har der ikke været nogen computerprogrammer, der har været i nærheden af at bestå Turing testen. Der er en pris, Loebner prisen, for det program, der kommer tættest på – se vinderne her. Man kan også læse udkrifter af konversationen under Turingtesten.

Det kinesiske værelse er et argument for, at man ikke kan lave kunstig inteligens. Se f.eks. Stanford Encyclopedia of philosophy eller Den Store Danske Encyklopædi.

This entry was posted in Blog. Bookmark the permalink.