Kategoriarkiv: Verden

DBpedia – RDF, SPARQL og værktøjer

Det var en god hack-aften i går aftes på ITU!

Det var en eksklusiv kreds, 5 stykker var vi, men det gjorde det bare nemmere at følge op på spørgsmål og indfald.

Det lykkedes at få installeret Virtuoso og indlæst en lille del af DBpedias datasæt, men vi endte med primært at bruge de allerede eksisterende SPARQL-grænseflader som f.eks. DBpedias SPARQL-endpoint og SNORQL, ikke mindst fordi det med en standardudgave af Virtuoso kun kunne lade sig gøre at loade omkring 1000 triples i sekundet…

Efterfølgende fik vi set nærmere på data, oprettet en wiki, fundet ud af en god del om Andy Warhol, foreslået en udvidelse af Swoogle samt påbegyndt et underholdende demonstrationsprojekt om reinkarnation!

Det var til tider særdeles underholdende, og det fortsætter forhåbentlig en anden dag. Indtil da kan man formentlig imødese nogle aktiviteter på wikien, og melde sig til på Semantic Web Meetup, Copenhagen.

Se desuden mine slides i S5-format — DBpedia — RDF, SPARQL og værktøjer (zip) — og et lille halvgammelt namespace-cheatsheet.

Красавчик

Det er efterhånden et godt stykke tid siden jeg har fået lagt et mandagsfoto op her på bloggen, nok ikke mindst fordi jeg ikke har fået fotograferet så meget på det sidste. Nu er lyset dog ved at være tilbage, og så kan det være der begynder at ske noget igen.

I mellemtiden er her et par links til nogle aktive fotoblogs på LiveJournal — de er russiske, så jeg ved ikke hvad der står, men det er flotte billeder:

Se i øvrigt også Morten Blinksbjergs Fugle (via Oschlag), jeg tror også jeg må få lavet mig et blærearkiv i stedet for den store samling.

NB: Jeg aner ikke hvad overskriften på dette indlæg betyder, jeg håber det ikke er provokerende eller diskriminerende…

Farvel dato…

Så kom det første offer for aviskrigen: Urban og Dato fusionerer.

Jeg skal ikke begræde at dato forsvinder, det er nok den gratisavis jeg har brugt mindst tid på. 166 udgaver af dato blev det til, sådan cirka 4 gange så mange udgivelser som Dagen

Om det får JP/Pol til også at lukke 24timer er nok tvivlsomt — de har trods alt ikke Urban, og Nyhedsavisen fortsætter formentlig et stykke tid endnu. Krigen er altså ikke aflyst, men det første slag er overstået.

GeoPress i Danmark

WordPress-udvidelsen GeoPress har været godt omtalt på det seneste, ikke mindst fordi Søren Johannessen henne hos Esben FjordEsbens blogtemplate kunne godt bruge en opfrisker, så man kan se når det er f.eks. Søren der skriver, jeg er ikke den eneste der oprindeligt tog fejl. har skrevet en fin vejledning til at komme godt i gang med GeoPress til WordPress.

Søren kan dog ikke redde GeoPress fra et halvdårligt indtryk set fra en brugers synspunkt. Det kan lade sig gøre at abstrahere fra, at listen over lokationer til at begynde med er tom, og tilsyneladende uden mulighed for at tilføje nye, men det er decideret frustrerende hele tiden at skulle starte forfra i “World View” når man skal finde et nyt sted i Hvidovre…

Der er flere mindre skøhedsfejl, men heldigvis er der tale om open source, så jeg har lavet en tilpasset udgave, der er lidt mere fleksibel og forudindstillet til brug i Danmark. Den er baseret på GeoPress v2.3, og er ændret så kortets position og zoom er indstillet til at vise Danmark (kan indstilles på Maps-siden):

Oversættelsen til dansk er endnu ikke på plads, men den skulle alligevel gerne være nemmere at bruge.

INSERT_MAP
INSERT_COORDS

NB: Som altid når man opgraderer WordPress-plugins: Husk at deaktivere den gamle version på pluginsiden og aktivere igen når den nye version er installeret.

Blogs hos Politiken

Politiken har nu lanceret deres tidligere omtalte blog-platform på weblog.dk. Indtil videre er det kun interne blogs, men inden længe bliver det muligt for enhver at oprette egen blog.

Det ser godt ud — helt som forventet når nu der bruges WordPress, men lidt spøjst at man bruger ordet “posteringer” til at omtale indlæg. Det er dog naturligvis bedre end at bruge ordet “blogs” til formålet — en blog er jo en samling indlæg. Nåja, og så er der er enkelt “required” i kommentarformularen der er smuttet i oversættelsen et sted.

Mere interessant er det at se, hvordan man tilsyneladende vil håndtere ophavsretten:

Ophavsret: Ophavsretten tilhører Politiken. Netavisens artikler og informationer må ikke elektronisk kopieres eller indekseres uden tilladelse. Materialet må ikke bruges og distribueres i kommercielt øjemed.

Det er den samme formulering der bruges på politiken.dk, men da det står på alle siderne på weblog.dk, må det antages også at gælde der. I forhold til feeds osv. kan det være problematisk, men jeg vil ikke selv oprette en weblog på de betingelser — jeg vil selv have lov til at bestemme hvilke evt. begrænsninger der skal være, og under ingen omstændigheder kan det være Politiken der har ophavsretten.

Den nye platform er blevet lanceret på domænet weblog.dk, som Overskrifts underskrift har en fin lille anekdote om. I den forbindelse kan jeg ikke lade være med at henvise til Thomas Froms analyse af udviklingen fra weblog til blog, specielt fordi jeg selv har domænet blog.dk (som kunne trænge til en designmæssig overhaling eller en ny ejer)…

Hack et leksikon med det semantiske web

For ikke særlig lang tid siden blev DBpedia frigivet til offentligheden, så det nu er muligt for alle at stille komplekse spørgsmål om data i Wikipedia. Det gør det muligt at få svar som man ellers ikke vil kunne finde ved almindelig fritekstsøgning a la Google.

DBpedia bygger på RDF, som udover at være en del af det semantiske web — hvad det så end er, måske web 3.0? — udmærker sig ved at være en simpel, grænsende til det smukke, datamodel, som man kan forespørge på ved hjælp af SPARQL.

Det smukke element er måske det matematikeren Claus Dahl faldet over, i hvert fald forsøger vi os nu med et joint-venture for at se hvad man kan få ud af DBpedia og dermed Wikipedia med RDF og SPARQL: DBPedia hack-aften?

Meld dig til, husk din bærbare, og lad os sammen se hvad der kan komme ud af en aften på ITU i selskab med en ordentlig bunke tripler