Blogpost

Herkennen van emoties in foto’s

December 5, 2018
7:02 pm
.data, AI, Conferences

Deze post is gebaseerd op de talk van Àgata Lapedriza tijdens de Deep Learning Summit in Londen.

Àgata Lapedriza is professor aan de Open Universiteit van Catalonië en visiting researcher bij MIT. Lapedriza doet research naar het herkennen van emoties in foto’s en video’s. Dit onderzoek trok meteen mijn belangstelling aangezien ik tijdens mijn stage (voordat ik bij Continuum aan de slag ging) soortgelijk onderzoek naar emoties heb gedaan.

Emoties

Onderzoek naar het herkennen van emoties mag voor sommigen ongewoon lijken maar dat is het helemaal niet. Er zijn verschillende dingen die zouden kunnen verbeteren moest men emoties accuraat kunnen herkennen, bijvoorbeeld educatieve applicaties. Deze zouden door middel van de emotie (bijvoorbeeld enthousiasme of verwarring) van de gebruiker bepaalde tips of oefeningen kunnen voorstellen. Maar ook in de zorgsector kunnen zulke systemen gebruikt worden om emoties van patiënten te herkennen en de nodige acties te ondernemen.

De meeste methodes om dit te verwezenlijken proberen de uitdrukkingen van het gezicht te analyseren in foto’s. Andere onderzoeken focussen op de schouders of het postuur van het lichaam. Spijtig genoeg schieten deze methodes vaak tekort. Welke emoties heeft de man op foto hiernaast? De capaciteit om emoties te herkennen bij andere personen is voor ons al niet altijd gemakkelijk. Maar wat als er meer informatie beschikbaar was?

Bovenstaande foto’s laten zien hoe de context de emotie kan doen veranderen. Alle vier de gezichten zijn identiek maar door de extra informatie in de foto kan een persoon gemakkelijk de emotie herkennen.

Om deze context te kunnen bepalen werd er een dataset van foto’s verzameld die geannoteerd zijn met het type van plaats (bijvoorbeeld een klaslokaal) en verschillende attributen. Ook werd er door Lapedriza een CNN (Convolutional Neural Net) gebruikt om de plaats en de attributen te bepalen.

Places

Gewapend met de methode om emoties te bepalen met behulp van gezichtsuitdrukkingen en de PlacesCNN kon men beginnen aan het verbeteren van de bestaande systemen. Er was maar één probleem: Gelabelde data.

Om de emotie te kunnen herkennen van individuele personen op foto’s met behulp van de context moesten ze voorbeelden hebben. Dit hebben ze gedaan door middel van de volgende stappen:

1. Foto’s scrapen van zoekmachines en bestaande research datasets
2. Een tool te creëren voor het annoteren van de foto’s
3. Crowdsourcing te gebruiken om zo veel mogelijk foto’s te annoteren

Meer info over de Places Demo kan je hier vinden.

VAD Emotional State Model

De hierboven afgebeelde tool laat de gebruiker toe om tussen 26 emoties te kiezen voor de aangeduide persoon op de foto. Ook is er de mogelijkheid om extra metadata te geven. Deze metadata is gebaseerd op het “VAD Emotional State Model”. Dit model omschrijft emoties doormiddel van 3 numerieke metrics: Valence (hoe aangenaam de situatie is), Arousal (hoe opgewonden de persoon is) & Dominance (of de persoon in controle is of niet). Deze drie metrics geven meer informatie over de emoties. Ook wordt er gender en leeftijdscategorie bijgehouden. Met al deze informatie is er een EMOTIC dataset gebouwd met 23,571 geannoteerde foto’s waarop 34,320 personen staan.

Deze dataset is gratis te downloaden.

De volgende stap was het combineren van de Places en EMOTIC datasets om zo de emoties en de VAD metrics te bepalen.

Dit systeem gebruikt twee CNNs, eentje dat pre-trained is op de imagenet dataset (verzameling van foto’s van objecten) en een tweede dat pre-trained is hun eigen places dataset. De eerste CNN neemt een kleinere versie van de foto als input met daarop de persoon waarvan de emotie bepaald moet worden. De tweede CNN krijgt de hele foto ter beschikking om zo kenmerken van de context te kunnen detecteren. De output van deze CNNs wordt dan gecombineerd om zo van beide systemen de informatie te kunnen gebruiken en een voorspelling te maken.

In deze figuur ziet men dat voor alle emoties, behalve “esteem”, de combinatie (B + I) van het persoon – (B) en context netwerk (I) beter scoort dan de netwerken apart.

Na de presentatie was natuurlijk de grote vraag: “Hoe zit het met video?” en natuurlijk zijn Lapedriza en haar team hier al mee bezig!

Lees ook zeker even de originele paper. Deze is goed te begrijpen en zeer interessant. Wil jij meer weten over machine learning of AI in het algemeen? Hou dan onze website in de gaten voor onze events? Of kom bij onze tribe!

Cookie	Duration	Description
__cfruid	session	Cloudflare sets this cookie to identify trusted web traffic.
cookielawinfo-checkbox-advertisement	1 year	Set by the GDPR Cookie Consent plugin, this cookie records the user consent for the cookies in the "Advertisement" category.
cookielawinfo-checkbox-analytics	1 year	Set by the GDPR Cookie Consent plugin, this cookie records the user consent for the cookies in the "Analytics" category.
cookielawinfo-checkbox-necessary	1 year	Set by the GDPR Cookie Consent plugin, this cookie records the user consent for the cookies in the "Necessary" category.
cookielawinfo-checkbox-others	1 year	Set by the GDPR Cookie Consent plugin, this cookie stores user consent for cookies in the category "Others".
cookielawinfo-checkbox-preferences	1 year	CookieYes set this cookie to record the user consent for the cookies in the category "Functional".
CookieLawInfoConsent	1 year	CookieYes sets this cookie to record the default button state of the corresponding category and the status of CCPA. It works only in coordination with the primary cookie.
elementor	never	The website's WordPress theme uses this cookie. It allows the website owner to implement or change the website's content in real-time.
viewed_cookie_policy	1 year	The GDPR Cookie Consent plugin sets the cookie to store whether or not the user has consented to use cookies. It does not store any personal data.

Cookie	Duration	Description
_ga	1 year 1 month 4 days	Google Analytics sets this cookie to calculate visitor, session and campaign data and track site usage for the site's analytics report. The cookie stores information anonymously and assigns a randomly generated number to recognise unique visitors.
_ga_*	1 year 1 month 4 days	Google Analytics sets this cookie to store and count page views.
_gat_UA-*	1 minute	Google Analytics sets this cookie for user behaviour tracking.
_gid	1 day	Google Analytics sets this cookie to store information on how visitors use a website while also creating an analytics report of the website's performance. Some of the collected data includes the number of visitors, their source, and the pages they visit anonymously.
AnalyticsSyncHistory	1 month	Linkedin set this cookie to store information about the time a sync took place with the lms_analytics cookie.
CONSENT	2 years	YouTube sets this cookie via embedded YouTube videos and registers anonymous statistical data.
ln_or	1 day	Linkedin sets this cookie to registers statistical data on users' behaviour on the website for internal analytics.

Cookie	Duration	Description
_rdt_uuid	3 months	Reddit sets this cookie to build a profile of your interests and show you relevant ads.
bcookie	1 year	LinkedIn sets this cookie from LinkedIn share buttons and ad tags to recognize browser IDs.
bscookie	1 year	LinkedIn sets this cookie to store performed actions on the website.
VISITOR_INFO1_LIVE	5 months 27 days	YouTube sets this cookie to measure bandwidth, determining whether the user gets the new or old player interface.
YSC	session	Youtube sets this cookie to track the views of embedded videos on Youtube pages.
yt-remote-connected-devices	never	YouTube sets this cookie to store the user's video preferences using embedded YouTube videos.
yt-remote-device-id	never	YouTube sets this cookie to store the user's video preferences using embedded YouTube videos.
yt.innertube::nextId	never	YouTube sets this cookie to register a unique ID to store data on what videos from YouTube the user has seen.
yt.innertube::requests	never	YouTube sets this cookie to register a unique ID to store data on what videos from YouTube the user has seen.

Cookie	Duration	Description
li_gc	5 months 27 days	Linkedin set this cookie for storing visitor's consent regarding using cookies for non-essential purposes.
lidc	1 day	LinkedIn sets the lidc cookie to facilitate data center selection.
UserMatchHistory	1 month	LinkedIn sets this cookie for LinkedIn Ads ID syncing.

Blogpost

Herkennen van emoties in foto’s

Emoties

Places

VAD Emotional State Model

Join our tribe

Contact