Blogpost

Machine learning – the black box unveiled

June 15, 2018
10:56 am
.data, AI, Conferences

Op dotAI passeerden verschillende interessante topics. Deze post focust op 1 van de grote pijnpunten betreft machine learning.

Machine learning modellen zijn van nature meestal niet interpreteerbaar. Het model zal je een uitkomst geven maar zal je niet vertellen hoe die uitkomst tot stand is gekomen. In machine learning kent men een afweging betreft interpreteerbaarheid. Eenvoudige algoritmen zoals lineaire regressie of decision trees zijn interpreteerbaar maar dat heeft tot gevolg dat ze vaak minder accuraat zijn dan de minder eenvoudig interpreteerbare algoritmen.

Interpreteerbaarheid

Diepe neurale netwerken die bij grote data hoeveelheden andere supervised machine learning qua accuraatheid voorbij steken zijn amper interpreteerbaar. Het zijn net deze netwerken die op dit moment de grenzen van AI onderzoek verleggen en de interpreteerbaarheid ervan is een achillespees die recent volop aandacht krijgt in AI onderzoek. Bij het opzoeken van de limieten van neurale netwerken in onderzoeksprojecten, is de interpreteerbaarheid vaak niet de eerste doelstelling. De winst van Alpha Go tegen de wereldkampioen van het spel Go is een voorbeeld waar men limieten verlegd heeft en waar de interpreteerbaarheid enkel relevant was voor de researchers om eventuele fouten te begrijpen en hun algoritme te verbeteren.

LIME algoritme

Als AI zijn intrede wil maken in het bedrijfsleven, dan zal de interpreteerbaarheid een grotere rol gaan spelen en in sommige contexten kan het een showstopper zijn als men de black box niet open kan doen. In sectoren zoals de geneeskunde gaat het om mensenlevens en een dokter kan niet handelen puur omdat een model zonder regels een indicatie geeft. Het kunnen begrijpen van een uitkomst zou zeker helpen om mensen te laten beslissen of een resultaat van een machine learning model te vertrouwen is. Het LIME algoritme biedt hier een oplossing en onderstaande afbeelding schetst een mogelijke context voor het gebruik ervan. Stel dat een model kan voorspellen of een patiënt de griep heeft: Deze voorspelling wordt vervolgens door het LIME algoritme verklaard door aan te geven welke symptomen het meest belangrijk waren bij het tot stand komen van een bepaalde voorspelling.

De dokter kan dan met zijn praktijkervaring beslissen of deze verklaring logisch lijkt te zijn en kan bijgevolg de voorspelling vertrouwen en erop verder bouwen. Elke machine learning engineer kan beamen dat de accuraatheid van een model tijdens de training niet altijd een goed indicator is van de performance van een model in productie. Het komt vaak voor dat er in productie voorspellingen gedaan worden die geen steek houden. De integratie van het LIME algoritme als een post processing stap na het aangeven van een voorspelling, is iets wat we bij Continuum gaan opnemen als een valide optie in classificatie projecten. Het LIME algoritme staat voor Local Interpretable Model-Agnostic Explanations.

Local: Het algoritme inspecteert enkel het gedrag van het model in de nabijheid van de instantie van de voorspelling die we willen verklaren.
Interpretable: De verklaring moet van die aard zijn dat een mens die kan begrijpen zonder kennis van het onderliggende model
Model-Agnostic: Het LIME algoritme staat los van het gebruikte algoritme voor de voorspelling.

De denkpiste achter het LIME algoritme is de veronderstelling dat een complex model lineair is op een lokale schaal. Voor elke predictie die we proberen te verklaren, gaat men de input data manipuleren. Stel dat de input van de predictie tekst is, dan zou men bv. willekeurig woorden beginnen te verwijderen van de input en deze gemanipuleerde input laten voorspellen door het model. Het algoritme gaat vervolgens kijken welke gemanipuleerde instanties qua predictie kort in de buurt van de te verklaren predictie ligt.

Vervolgens wordt gekeken welke features het beste in staat zijn om het model lokaal te verklaren en vervolgens bouwt men met deze features een simpel lineair model. Het zijn deze features die ten slotte gebruikt worden om de verklaring te doen door naar hun gewichten in het lineaire model te kijken.Te ingewikkeld?

Deze tekening geeft dit proces grafisch in 2 dimensies weer om dit visueel te kunnen weergeven. In de realiteit gaat het uiteraard niet om 2 dimensies.

De originele beslissingsfunctie van het model wordt voorgesteld door de roze/blauwe achtergrond en deze is duidelijk niet lineair.

Het heldere rode kruis is de instantie die we gaan verklaren. De gemanipuleerde instanties zijn de blauwe bollen en de rode minder heldere kruisjes. Het geleerde lineaire model is de streepjeslijn. Het volgende voorbeeld probeert het nog wat duidelijker te maken en geeft aan hoe het LIME algoritme verklaarbaarheid kan geven voor classificatie van afbeeldingen. Het algoritme moet voorspellen of een kikker aanwezig is in de afbeelding. De afbeelding wordt door het LIME algoritme ingedeeld in verschillende regio’s. Elk van die regio’s worden uit de afbeelding gehaald en er wordt een evaluatie gedaan van het algoritme zoals reeds hierboven besproken. Het resultaat is dat enkel het gedeelte dat het belangrijkste was om de kikker te herkennen zichtbaar is voor een gebruiker.

De onderstaande verklaring komt intuïtief overeen met hoe wij patroonherkenning doen en het wekt bijgevolg vertrouwen in de uitkomst. Het LIME algoritme is een eerste stap in de richting waarin de steeds complexer wordende AI modellen niet langer black boxes zijn. Indien we dit probleem verhelpen, dan zal de integratie van AI in de bedrijfswereld nog meer in een stroomversnelling geraken.

Wil jij mee helpen om AI in een stroomversnelling te brengen in het bedrijfsleven? Misschien is werken bij Continuum iets voor jou! Check onze vacatures!

Cookie	Duration	Description
__cfruid	session	Cloudflare sets this cookie to identify trusted web traffic.
cookielawinfo-checkbox-advertisement	1 year	Set by the GDPR Cookie Consent plugin, this cookie records the user consent for the cookies in the "Advertisement" category.
cookielawinfo-checkbox-analytics	1 year	Set by the GDPR Cookie Consent plugin, this cookie records the user consent for the cookies in the "Analytics" category.
cookielawinfo-checkbox-necessary	1 year	Set by the GDPR Cookie Consent plugin, this cookie records the user consent for the cookies in the "Necessary" category.
cookielawinfo-checkbox-others	1 year	Set by the GDPR Cookie Consent plugin, this cookie stores user consent for cookies in the category "Others".
cookielawinfo-checkbox-preferences	1 year	CookieYes set this cookie to record the user consent for the cookies in the category "Functional".
CookieLawInfoConsent	1 year	CookieYes sets this cookie to record the default button state of the corresponding category and the status of CCPA. It works only in coordination with the primary cookie.
elementor	never	The website's WordPress theme uses this cookie. It allows the website owner to implement or change the website's content in real-time.
viewed_cookie_policy	1 year	The GDPR Cookie Consent plugin sets the cookie to store whether or not the user has consented to use cookies. It does not store any personal data.

Cookie	Duration	Description
_ga	1 year 1 month 4 days	Google Analytics sets this cookie to calculate visitor, session and campaign data and track site usage for the site's analytics report. The cookie stores information anonymously and assigns a randomly generated number to recognise unique visitors.
_ga_*	1 year 1 month 4 days	Google Analytics sets this cookie to store and count page views.
_gat_UA-*	1 minute	Google Analytics sets this cookie for user behaviour tracking.
_gid	1 day	Google Analytics sets this cookie to store information on how visitors use a website while also creating an analytics report of the website's performance. Some of the collected data includes the number of visitors, their source, and the pages they visit anonymously.
AnalyticsSyncHistory	1 month	Linkedin set this cookie to store information about the time a sync took place with the lms_analytics cookie.
CONSENT	2 years	YouTube sets this cookie via embedded YouTube videos and registers anonymous statistical data.
ln_or	1 day	Linkedin sets this cookie to registers statistical data on users' behaviour on the website for internal analytics.

Cookie	Duration	Description
_rdt_uuid	3 months	Reddit sets this cookie to build a profile of your interests and show you relevant ads.
bcookie	1 year	LinkedIn sets this cookie from LinkedIn share buttons and ad tags to recognize browser IDs.
bscookie	1 year	LinkedIn sets this cookie to store performed actions on the website.
VISITOR_INFO1_LIVE	5 months 27 days	YouTube sets this cookie to measure bandwidth, determining whether the user gets the new or old player interface.
YSC	session	Youtube sets this cookie to track the views of embedded videos on Youtube pages.
yt-remote-connected-devices	never	YouTube sets this cookie to store the user's video preferences using embedded YouTube videos.
yt-remote-device-id	never	YouTube sets this cookie to store the user's video preferences using embedded YouTube videos.
yt.innertube::nextId	never	YouTube sets this cookie to register a unique ID to store data on what videos from YouTube the user has seen.
yt.innertube::requests	never	YouTube sets this cookie to register a unique ID to store data on what videos from YouTube the user has seen.

Cookie	Duration	Description
li_gc	5 months 27 days	Linkedin set this cookie for storing visitor's consent regarding using cookies for non-essential purposes.
lidc	1 day	LinkedIn sets the lidc cookie to facilitate data center selection.
UserMatchHistory	1 month	LinkedIn sets this cookie for LinkedIn Ads ID syncing.

Blogpost

Machine learning – the black box unveiled

Interpreteerbaarheid

LIME algoritme

Join our tribe

Contact