Kategoriarkiv: Det semantiske web

http://www.w3.org/2001/sw/

NatFilm: SPARQL og Exhibit

Årets Natfilmfestival, den 19. og sidste i rækken, begynder i morgen, og traditionen tro har jeg inviteret en bunke venner i biffen, så jeg kan få set nogle stykker, selvfølgelig under hensyntagen til almindelig programlægningsudfordringer i forhold til kalenderaktiviteter.

Natfilmavisen er god til at få indtryk af de enkelte film, men ikke god til at få overblik af, og hjemmesiden er desværre ikke meget bedre. Sådan har det altid været, og for nogle år siden rykkede jeg derfor koordineringen på nettet (via PHP, XSLT og Redland), naturligvis baseret på semantiske principper og med udgangspunkt i en screen-scraped udgave af natfilmshjemmesiden.

Således også i år, hvor jeg desuden har lavet et hurtigt SPARQL-interface (ved hjælp af kun tre liniers PHP), og et forsøg på at anvende SIMILE’s Exhibit til at give nem adgang — det sidste hjælper måske heller ikke på overblikket, men det er en start.

Hvis så bare de gode folk bag festivalen havde inkluderet links til f.eks. IMDB, så det var muligt at få gang i noget sammenhængende data uden at få skrivekrampe…

Jeg har af måske indlysende årsager kun medtaget de kun Københavnske fremvisninger i udtrækket, men skulle man have et ønske om et komplet datasæt, er det blot at fjerne en enkelt linie i GRDDL-transformationen: natfilm-grddl.xsl.

Ærgeligt nok er det jo sidste gang det er relevant med alt det her, men mon ikke jeg får noget op at køre når den nye sammenlægningsfestival får premiere til næste år…

OpenID — nu med billeder

OpenID

Det påstås her og der, at OpenId er fremtidens digitale signatur. Det er nok tvivlsomt, men der er nok ingen tvivl om at vi kommer til at se mere til det her og der, specielt nu da OpenID 2.0 er på banen, skarpt efterfulgt af OAuth 1.0. Også Wired har opdaget mulighederne, DiSo er undervejs, og selv undertegnede har nu en implementering på plads.

Takket være JanRains PHP OpenID Library var det ikke svært, men jeg har alligevel lavet en simplificerende wrapper, som gør det endnu nemmere at få op at køre.

Mest interessant er det dog, at jeg har fået OpenID til at spille sammen med min fotodatabase. Den har ellers været lukket delvist ned af hensyn til svage sjæle, men nu er den altså åben igen, så man kan se sine egne og venners billeder — hvis altså man har et OpenID tilknyttet sin weblog eller en email-adresse jeg kender, og hvis jeg har været flittig nok med beskrivelserne. Prøv det — og sørg for at få taget et billede med mig næste gang du ser mig med mit kamera! Skriv endelig hvis det ikke spiller, eller hvis den ikke viser de forventede billeder, så skal jeg gøre hvad jeg kan for at få det på plads. Husk: Tålmod kommer til den der venter.

Skulle du være interesseret i de mere tekniske detaljer bag systemet, kan du læse mere om SPARQL, FOAF og OpenID i Authorization by Codepiction.

Freebase

Jeg har kigget lidt rundt på Freebase, som er en slags hyperstruktureret udgave af Wikipedia — den kan redigeres af alle, men det er ikke bare fri tekst, alting struktureres via relationer og typer. Samtidig baserer det sig — ligesom dbpedia — på frit tilgængelige oplysninger fra andre database, f.eks. netop Wikipedia og MusicBrainz. Alle informationerne i Freebase-databasen bliver naturligvis stillet til rådighed for alle under en Creative Commons-licens.

Tim O’Reilly har tidligere skrevet om Freebase, at den kan fungere som en bro mellem web 2.0 og det semantiske web, og det er et rigtig interessant perspektiv, ikke mindst fordi datamodellen med type og relationer let lader sig oversætte til RDF, og fordi forbindelserne er reelle forbindelser, ikke bare forbindelser baseret på navnesammenfald.

Som sædvanligt er en geografisk præsentation god til at illustrere princippet: Jeg har noteret på min Freebase-profil, at min “Hvor jeg bor”-relation er til Hvidovre (ikke til teksten “Hvidovre, Danmark”, og ikke noget med koordinater), og vupti — via et klassisk mashup kan jeg ses på oversigten over Freebase-brugere:

Freebase-brugere på Google Maps

Freebase er indtil videre stadig i “alpha”, men jeg har fået tildelt 5 invitationer, så hvis du er interesseret og hurtig kan du jo lægge en kommentar.

DBpedia – RDF, SPARQL og værktøjer

Det var en god hack-aften i går aftes på ITU!

Det var en eksklusiv kreds, 5 stykker var vi, men det gjorde det bare nemmere at følge op på spørgsmål og indfald.

Det lykkedes at få installeret Virtuoso og indlæst en lille del af DBpedias datasæt, men vi endte med primært at bruge de allerede eksisterende SPARQL-grænseflader som f.eks. DBpedias SPARQL-endpoint og SNORQL, ikke mindst fordi det med en standardudgave af Virtuoso kun kunne lade sig gøre at loade omkring 1000 triples i sekundet…

Efterfølgende fik vi set nærmere på data, oprettet en wiki, fundet ud af en god del om Andy Warhol, foreslået en udvidelse af Swoogle samt påbegyndt et underholdende demonstrationsprojekt om reinkarnation!

Det var til tider særdeles underholdende, og det fortsætter forhåbentlig en anden dag. Indtil da kan man formentlig imødese nogle aktiviteter på wikien, og melde sig til på Semantic Web Meetup, Copenhagen.

Se desuden mine slides i S5-format — DBpedia — RDF, SPARQL og værktøjer (zip) — og et lille halvgammelt namespace-cheatsheet.

Hack et leksikon med det semantiske web

For ikke særlig lang tid siden blev DBpedia frigivet til offentligheden, så det nu er muligt for alle at stille komplekse spørgsmål om data i Wikipedia. Det gør det muligt at få svar som man ellers ikke vil kunne finde ved almindelig fritekstsøgning a la Google.

DBpedia bygger på RDF, som udover at være en del af det semantiske web — hvad det så end er, måske web 3.0? — udmærker sig ved at være en simpel, grænsende til det smukke, datamodel, som man kan forespørge på ved hjælp af SPARQL.

Det smukke element er måske det matematikeren Claus Dahl faldet over, i hvert fald forsøger vi os nu med et joint-venture for at se hvad man kan få ud af DBpedia og dermed Wikipedia med RDF og SPARQL: DBPedia hack-aften?

Meld dig til, husk din bærbare, og lad os sammen se hvad der kan komme ud af en aften på ITU i selskab med en ordentlig bunke tripler

Velkommen til Web 3.0

Den anden dag blev begrebet Web 3.0 (re-)introduceret — denne gang i forbindelse med det Semantiske Web. Projektet er som bekendt Tim Berners-Lee‘s oprindelige vision for World Wide Web, men har hidtil levet en lidt stille og undervurderet tilværelse.

Nu begynder det ikke bare at dukke op i avisartikler, men også i konkrete og anderledes hypede projekter: Janus Friis‘ seneste projekt, The Venice Project, bruger en hel del RDF, herunder både FOAF og OWL. Projektet er i øvrigt stadig i lukket beta, så det er ikke meget der må slippe ud — jeg ved ikke engang, om jeg må sige om jeg synes det er spændende eller ej…

Spændende tider.

Tillykke WWW!

Esben Fjord påpeger at World Wide Web har fødselsdag (i går den 6. august).

Det er en væsentlig opfindelse der fylder 15 år. De fleste er nok enige om, at i hvert fald en god del af verden ville have set anderledes ud, hvis ikke Tim Berners-Lee havde tænkt tankerne — og gjort dem tilgængelige for alle uden beregning og patenter. Skulle man mene at WWW ikke når ud i alle verdens små afkroge, kan man jo kaste et blik på Kiva.

Esben peger også på den oprindelige annoncering, men af den fremgår det faktisk ikke, at en væsentlig del af pointen med World Wide Web faktisk var, at det ikke skulle være envejs-kommunikation, det skulle være muligt for alle både at skrive og læse. Samtidig var det også den oprindelige tanke, at der skulle være mening i links, og dermed er World Wide Web faktisk bare en første udgave af Det Semantiske Web — man burde nok vente med Web 2.0 indtil man havde Web 1.0 på plads…

Legeplads

Genstart har det.

Google har haft det i et stykke tid.

Dalager og Classy kunne godt tænke sig det.

Og nu har jeg det også:

En samlet oversigt over de forskellige online-projekter der er blevet — og bliver — produceret fra min hånd. Et sandkasse-indeks:

Morten Frederiksen » Lab Jeg har kaldt det “Lab”, ikke “Labs”, for jeg mener ikke jeg kan retfærdiggøre at omtale det i flertal, heller ikke selvom jeg har maskiner i flere rum i huset. Og så er det lige en smule mere internationalt…

Om det kan få mig til at leve op til Genstart’s motto “Learning by shipping” — eller den med “release early, release often” — er måske tvivlsomt, men man kan jo håbe. I hvert fald er det endnu ikke alle projekterne der er på listen endnu, så alene det giver jo håb…

Indtil videre er den drevet af Planet Planet og min lokale RDF/triple-database baseret på Redland, men af hensyn til muligheden for feedback tror jeg måske jeg lægger den om til en selvstændig WordPress-blog, så skulle det være til at kommentere på de enkelte projekter. På den anden siden er der jo nogle af dem der har tilknyttet en selvstændig blog-post andetsteds, hmmm…

PS: Alle projekterne er beskrevet på engelsk — man er vel ambitiøs — men jeg syntes alligevel det kunne være skægt at skabe lidt community-sense omkring danskproducerede projekter, så mit lab indeholder også en lille liste med andre danske “labs”. Den er styret af del.icio.us, så andre kan være med til at vedligeholde listen, blot ved at tagge med “labs” og “dk” (feed).

Planet Reboot

reboot 7.0 er ikke begrænset til selve konferencelokalerne, der er både en wiki med kommentarer og en #reboot7 IRC-kanal, og som vi så i går foregår det også per videotelefon.

Det betyder at reboot også er tilgængeligt udefra, og det har Danny Ayers udnyttet til at lave Planet Reboot. Den er drevet af FOAF, RDF og SPARQL, og selvom den i alpha-udgaven ikke helt kan måle sig med technorati’s linkliste (eller flickr’s reboot fotos), har den klare fordele, f.eks. at det kun omfatter lige præcis dem der har meldt sig som deltagere på reboot 7.0, og den ikke indeholder links der handler om maskiner der genstarter…

Se også: Mine reboot fotos