Strukturerad data & Schema markup - Stora uppdateringarna och lite om framtiden

Inledning

Internet handlar i mångt och mycket om relationer mellan innehåll. Relationer mellan författare och publicerade artiklar. Relationer mellan produkter och varumärken. Relationer mellan innehåll och en sökfras. Svaret man får på en fråga man ställer baseras på hur väl en sökmotor kan identifiera ett svar. Vilket är relationer till innehåll. Detta hjälper strukturerad data och i synnerhet schema markup till med.

Strukturerad data har länge varit en viktig del för sökmotorer. En genomgående implementation av strukturerad data ger en fördel inom SEO, dels för att sökmotorer får en djupare förståelse för vad en webbplats innehåller och dels för att webbplatsen får möjlighet att sticka ut i sökresultat. Med en genomgående strategi för strukturerad data har man stora fördelar mot sina konkurrenter.

Google arbetar allt mer med att hämta information från webbplatser för att visa upp den relevanta informationen redan i sökresultatet. Det har pågått länge i form av alla tänkbara snippets och utökade sökträffar. Att vi har passerat tiden där sökresultatet var en lista kan nog alla vara överens om. Nu går vi mer mot att en webbplats funktion är att vara en källa till information som hämtas och visas upp någon annanstans.

Den största uppdateringen på länge (september 2022) är hur produkter kan visas upp på Google genom schema markup. Detta påverkar alla webbsidor som har försäljning online. Både Google och Schema.org har haft ett stort fokus på att uppdatera hur produkter visas upp vilket innebär att en e-handlare inte längre behöver ha ett merchant center för att lista sina produkter i de olika typer av sökresultat som finns tillgängliga.

Utbildning och videoinnehåll har kontinuerligt varit i fokus där det lanserades en helt ny property för learning videos, men även uppdateringar för att visa upp specifika delar av en video i form av "key moments".

I bildsöket visas numera produkter markerade med länk direkt till produktsidan om man har rätt uppmärkning. Vi ser även hur en mängd olika typer av knowledge panels byggs upp för företag.

Hur AI kommer använda sig av strukturerad data återstår att se, men det verkar inte som om Google har dragit ner på takten för deras användning av strukturerad data.

Nedan är mina rubriker i texten för de som vill hoppa över introduktionen

Vad är Schema.org?
Varför och hur är strukturerad data positivt för en webbplats?
Schema markup och AI
Om uppdateringar på Schema.org
De senaste förändringarna inom schema markup
Strukturerad data alla webbplatser bör ha
Pending - Några Eventuellt kommande uppdateringar
Terminologi och förväxlingar inom strukturerad data och schema

Vad är schema.org?

Schema.org, är ett community inom W3C som arbetar för att skapa en webbstandard för hur data struktureras i relation till innehåll på internet. Grundarna är från Google, Microsoft, Yahoo och Yandex.

Strukturerad data är exakt vad det låter som: data som är strukturerad och det som struktureras är innehåll på hemsidor. Ju bättre struktur desto bättre kan sökmotorer presentera sökresultat i rätt kontext. Strukturerad data är inte enbart för Google utan används av samtliga större sökmotorer och det finns en överenskommelse mellan de stora sökmotorerna hur strukturerad data ska fungera.

Schema.org har funnits länge och idag används det i hög grad av sökmotorer för att skapa en djupare och mer semantisk förståelse för innehåll, hur det visas upp och för vilka användare.

Schema.org innehåller de officiella uppdateringarna, sedan finns webschemas.org som innehåller de absolut senaste arbeten som pågår och de senaste förändringarna.

Utvecklingen av strukturerad data på Schema.org sker både med en styrgrupp och en konsensus-approach. Större förändringar exempelvis en ny typ av schema markup eller en core-uppdatering går oftast via konsensus inom community:t och mindre uppdateringar och buggfixar kan fast-trackas via styrgruppen.

Schema.org består av en core-sektion och en pending-sektion. Pending-sektionen är lite som Schemas staging-miljö där de schemas som fortfarande saknar delar finns. I denna lista är de som ligger som pending blåmarkerade (klicka på en typ kommer trädet att öppnas). De går att använda men kommer sannolikt att förändras och behöver i så fall övervakas. Uppdateras delar kan den strukturerade datan sluta att validera.

Varför och hur är strukturerad data positivt för en webbplats?

Strukturerad data har både att göra med att sticka ut i sökresultatet med hjälp av rikare sökresultat (rich snippets) men lika mycket (om inte mer) att ge sökmotorer en djupare och mer semantisk förståelse för innehållet samt bygga upp sökmotorers egna databaser.

Schema markup bygger i sin helhet på en relation mellan "types" och "properties", där "Type" är en typ av innehåll. Det kan tex vara sidor om själva organisationen, en produkt, eller en jobbansökan. "Properties" är information i själva innehållet. På en organisationssida kan det röra sig om kontaktuppgifter, ett evenemang innehåller tid och plats, en produkt innehåller pris och recensioner.

Inom varje property finns även olika typer av "data types" tillgängliga där värdet behöver vara tillgängligt i form av information eller data.

Idag finns ett stort antal typer av schema och det finns framtagna ramverk för hur en implementering kan se ut för: hotell och resebranchen, musikindustrin, finansbranschen, bilbranschen, läkemedelsbranschen etc. Beroende på vad en webbplats innehåller finns det alltid möjligheter att strukturera upp data med schema.org.

För att testa schema markup finns det två primära verktyg: ett framtaget av Google och ett av schema.org.

Google: Rich result test
Schema.org: Schema markup validator
Även Screaming frog funkar oftast bra för att validera schema markup. Här finns en guide för hur man konfigurerar Screaming frog för att validera strukturerad data.

Jag vill dock slänga in en brasklapp att Screaming frogs validering av schema inte alltid stämmer. Ett valideringsfel Screaming frogs gjorde ganska nyligen var på uppmärkningen av https://schema.org/addressCountry i relation till en produkt där Screaming frog gav error för att fälten inte var i ISO-format vilket inte stämmer. Man bör alltid dubbelkolla valideringen med schema.org eller Googles verktyg.

Schema markup och AI

Hur och vilken roll schema markup kommer att spela för ett AI är spekulativt, men med den utgångspunkten kan vi föra ett resonemang och då behöver vi gå till grunden för hur sökmotorer idag bygger upp sin så kallad kunskapsgraf (knowledge graph) som även används inom machine learning.

När jag ställde frågan "will schema markup matter to ai?" till ChatGPT var svaret följande:

"Yes, schema markup can matter to AI, particularly when it comes to natural language processing and understanding. Schema markup provides structured data that helps search engines and other AI systems understand the content and context of web pages more effectively. It provides explicit information about the type of content, its attributes, and relationships with other elements on the page.

When AI systems encounter web pages with schema markup, it becomes easier for them to extract and interpret relevant information. This can lead to improved search engine results, enhanced knowledge graph generation, and more accurate understanding of entities, events, and relationships." - ChatGPT

Googles eller Bings kunskapsgraf är inte det vi ser utan vad dom vet. Deras databas. Den används för att skapa de sökresultat vi ser. En kunskapsgraf byggs upp genom att Google eller Bing samlar in och organiserar information från olika källor på webben.

När detta sker definieras något som kallas entiteter. En entitet är en specifik och distinkt individ, objekt, plats, person, organisation eller begrepp som kan identifieras och beskrivas.

Entiteter kan vara människor (som kändisar eller politiker), platser (som städer eller sevärdheter), organisationer (som företag eller institutioner), produkter, evenemang eller abstrakta begrepp (som idéer eller teorier). Varje entitet har sina egna attribut och relationer som definierar och karakteriserar den.

Genom att identifiera och förstå entiteter och alla relationer kring dessa kan information organiseras och relateras till varandra för att skapa en strukturerad och sammanhängande kunskapsbas.

Genom att crawla och indexera webbsidor identifierar Google entiteter och extraherar information om dem. Denna information integreras sedan i kunskapsgrafen som blir (är) en omfattande databas av sammanlänkade entiteter och deras attribut. Genom att analysera relationer och sammanhang mellan entiteter i grafen kan Google förbättra sökresultaten och presentera relevant information direkt i sökresultaten. Sökmotorerna arbetar med att identifiera relationer och det är här schema markup kommer in i bilden.

Schema markup handlar i sin grund om att bygga upp kunskaps-grafer åt sökmotorer på det språk som sökmotorer förstår. En kunskapsgraf förklarar för en sökmotor relationen mellan innehåll och skapar en djupare semantisk förståelse. Ett enkelt exempel är relationen mellan ett blogginlägg och en författarsida. Utan schema finns ingen direkt koppling men med schema skapas kopplingen.

Schema.org är den standardiliserade metoden att strukturera upp data som sökmotorer förstår och som hjälpler sökmotorer att bygga upp kunskapsgrafen.

Ju fler relationer som skapas på en webbplats med schema desto större blir kunskapsgrafen och en desto djupare semantisk förståelse får en sökmotor om innehållet.

Sökmotorer använder schema markup och kunskapsgrafer som en del av de datakällor som idag används inom machine learning för att skapa nya kunskapsgrafer. Genom att bygga upp kunskapsgrafer genom schema blir därmed webbplatserna sannolikt en större del inom den machine learning som tränar ett AI och våra webbplatser bli mer AI-ready.

Om uppdateringar på schema.org

Sedan 2020 har det gjorts över 100 officiella uppdateringar på schema.org, där majoriteten gjordes under 2021 och 2022 och frekvensen av uppdateringar har ökat på schema.org samt att Google arbetar aktivt för att sökmotorn ska använda sig av strukturerad data.

Vissa uppdateringar handlar enbart om mindre justeringar, medan andra handlar om helt nya typer. Tittar man på de 100 senaste uppdateringarna på schema.org är det i huvudsak kategoriserade efter:

Förtydligande av riktlinjer och dokumentation: uppdateringar för att förtydliga hur en uppmärkning ska implementeras.
Regionuppdateringar: Denna är väldigt intressant eftersom vissa snippets bara är tillgängliga i vissa regioner. Ett exempel är Jobposting där Sverige ännu inte finns med samt speakable som fortfarande enbart är tillgänglig i USA.
Förändringar inom rekommenderade eller nödvändiga properties: Det sker ständigt uppdateringar av vilka properties som är nödvändiga och vilka som är rekommenderade för att scheman ska validera.
Helt nya typer av schemas och snippets: Learning Videos är det senaste exemplet. Att hålla koll på när dels schema.org har en ny men även när Google har en ny typ av snippet eller widget gör att man kan vara tidigt ute.
Major update: En större uppdatering inom en typ, den senaste uppdateringen för produkter är ett exempel.
Schema versionsuppdatering: Lite då och då uppdateras hela ramverket med en mängd olika uppdateringar i en mängd områden, lite likt de core uppdateringar som Google rullar ut då och då. Jag har tittat lite på vad som hände i de senaste större uppdateringarna 15 och 16.

De senaste förändringarna inom schema markup

I schemas core uppdatering 15.0 låg e-handeln i fokus. Det har tagits fram en mall för att markera upp checkout-sidor. Detta för att sökmotorer ska få en bättre förståelse för vad som händer när en användare går från en produktsida till en checkout-sida där varan blir såld. Och det som väldigt nyligen lades till var en sektion för "return policy".

OfferShippingDetails ligger som pending för att ange en produkts fraktmått.
DefinedRegion ligger också som pending för att ange vilka regioner en produkt kan levereras till vilket i sin tur kan påverka prissättning.
PositiveNotes och negativeNotes ligger som pending vilket skulle vara ett sätt att lyfta positiva egenskaper med produkter eller en pros and cons lista för recensioner.

Det lades till nya exempel för Blog och Blogposting. Detta är en del av article-schema som är under ständig utveckling. De flesta sidor har idag någon form av artikelflöde där det är väldigt relevant att ha en korrekt uppmärkning som leder till att ens artiklar syns i rätt sammanhang. I vissa fall kan det leda till att ens artiklar både syns i Googles top stories, Google news och genom Google assistant sökningar.

I 16.0 lades det bland annat till en del de kallar för Vacation rental som syftar till de som arbetar med uthyrning. De beskriver det så här: A kind of lodging business that focuses on renting single properties for limited time. Vilket känns som en anpassning till AIRBNB och liknande.

Här är en länk till schema.org uppdateringar.

Stora förändringar för produkters schema markup

I slutet av 2022 gjordes en markant uppdatering för hur man kan arbeta med strukturerad data för produkter. Schema.org och Google arbetar aktivt för att utöka produktupplevelsen, Product rich results, alltså produkt-snippets, så som pris och recensioner, lanserades under 2020 och är idag näst intill standard för en e-handlare. Utöver det har Google låtit e-handlare använda sig av Google Merchant Center vilket har skapat en betydligt större upplevelse av produkter i sökresultaten.

Merchant center fungerar som ett tredjepartsverktyg där man laddar upp en XML-feed med en hel del riktlinjer. Den stora skillnaden nu är att man inte behöver använda sig av xml-feeds eller merchant center över huvud taget för att få samma typ av organiskt sökresultat, utan man kan styra detta direkt på sin webbplats med strukturerad data. Google har lagt till properties som låter strukturerad data skapa hela den produkt-upplevelse som merchant center tidigare har erbjudit.

Det nya produkt schemat ger dessa möjligheter:

Product review page: Funnits sedan tidigare
Shopping aggregator page:** Nytt för schema**
Pros and cons: Nytt för schema
Product page with an offer: Funnits sedan tidigare
Product with an offer and shipping details: Nytt för schema
Indicating free shipping:** Nytt för schema**
Pricing: Funnits sedan tidigare
Pricing with unit pricing measures: Nytt för schema
Energy efficiency ratings: Nytt för schema
MerchantReturnPolicy är den absolut senaste uppdateringen i scheman för produkter.

Detta möjliggör att genom strukturerad data kunna visa upp sina produkter både i Googles Popular products, Shopping knowledge panel och Google Images.

Fokus på utbildning

Google lägger även ett stort fokus på att lyfta utbildningsrelaterat material. Under 2022 släpptes en helt ny strukturerad data för Learning videos som uppdaterats ett flertal gånger.

Learning video är tillgängligt i alla regioner men just nu (maj 2023) enbart för engelskt utbildningsmaterial i videoformat för akademiska sökningar. Vad akademisk nivå innebär är nog dock en tolkningsfråga.

Learning video kräver att man använder minst en av nedan properties:

EducationalAlignment: Den officiella standardkoden, klassen eller examen som är associerad med innehållet. Använd endast denna egenskap om ditt innehåll är anpassat till en specifik standard eller examen.
EducationalLevel: Här definierar man vilken nivå utbildningsmaterialet har och riktar sig mot. Detta kan vara universitetsnivå, gymnasienivå etc.
LearningResourceType: Denna property ger ett visst svängrum för denna strukturerade data. Nedan är de exempel som Google tar upp

Några exempel av videos som är relevanta för Learningvideo är:

Concept overview: Videon förklarar ett ämne eller begrepp.
Problem walkthrough: Videon visar metoder eller stegen för att lösa ett akademiskt problem, såsom ett matematik- eller naturvetenskapligt ordproblem.
Real life example: Videon visar hur ett begrepp tillämpas eller används i verkliga livet.
Activity: Videon visar en demonstration eller tillämpning av en inlärningsaktivitet, såsom ett exempel, ett improviserat spel, en konceptkarta, en peer review eller en tvungen debatt.
Experiment: Videon visar ett experiment.
Lecture: Videon visar en lektion, föreläsning eller webbinarium.
**How-to: **Videon tillhandahåller en metod eller en serie steg för att göra något. Tips: Videon delar med sig av tips och tricks.

Denna implementering skapar en tjusig snippet men sannolikt handlar det lika mycket om att synas i de sökningar som är relevanta för utbildning.

Utbildningsrelaterade frågor och svar

Frågor och svar har funnits som schema ganska länge och i maj 2022 lanserades även

Education Q&A och uppdaterades sedan i augusti. Education Q&A är en helt ny typ av strukturerad data för frågor och svar som kommer som en följd av den strukturerade data som finns för practice problems och math solvers.

Education Q&A är som det låter, frågor och svar med en utbildningsfunktion. Det kan vara ett quiz eller ett frågespel och har två properties

**Flashcard page: **en sida som innehåller ett flash card vanligtvis en fråga på en sida och ett svar på den andra
Single Q&A page: en sida som har en fråga med ett användargenererat svar

Google ställer krav på att informationen är korrekt och det man får i sökresultatet är en Q&A-karusell högst upp.

Strukturerad data för jobb

Jobposting är en typ av strukturerad data värd att hålla ögonen på då Google har i en mängd regioner aktiverat en widget som är en jobbsökarfunktion direkt i sökresultaten. För närvarande är den inte tillgänglig i Sverige men listan av tillgängliga regioner uppdateras då och då. Senast i mars togs sydkorea bort från listan av regioner där jobposting är tillgängligt av någon anledning.

För många, om inte de flesta, är rekrytering en viktig funktion för webbplatsen. Genomför man rekrytering i regioner där jobposting är tillgängligt är denna typ av strukturerad data en stor möjlighet.

Strukturerad data alla webbsidor bör ha:

Sker försäljning på en webbplats är strukturerad data en nödvändighet och som tidigare nämnt nära en webbstandard. Men det finns mycket att göra för webbplatser utanför ehandelsvärlden.

Organization**: **Att definiera upp vilken typ av verksamhet man bedriver är en av de mest fundamentala delarna i schema. Det finns idag organisations-kategorier för nästan alla typer av organisationer och det finns idag ett större antal som ligger som pending vilket antyder att listan ständigt ökas för att webbsidor ska kunna på tydligt vis berätta för sökmotorer vad de gör. Det finns en stor mängd information kopplats till denna typ såsom vilka som grundat organisationen, LEI-kod, kontakt uppgifter, plats, awards, antal anställda etc. En intressant property som ligger som pending är diversityPolicy.

Local business**: Är en typ av Organization-schema. **Har ett företag en fysisk adress är denna uppmärkning en näst intill nödvändighet. Använder man denna kommer Google automatiskt att hålla sina karttjänster uppdaterade med kontaktuppgifter, öppettider, telefonnummer etc. Fördelen att använda schema markup istället för Google My Business är att man enbart behöver hålla sin webbplats uppdaterad istället för att fylla i samma uppgifter i Google My Business.

Article: De flesta sidor har idag någon form av artikelflöde. En korrekt uppmärkning av article schema leder dels till att ens artiklar syns i rätt sammanhang. I vissa fall kan det leda till att ens artiklar både syns i Googles top stories, Google news och genom Google assistant sökningar. Och det leder till att bilder och videos från artikeln kan visas upp direkt i sökresultatet.

Nedan är de typer av article schema tillgängliga.

How to - Är en uppmärkning för artiklar som stegvis beskriver hur man gör något, i vilka steg och hur lång tid det tar. Även denna skapar en trevlig snippet som visar upp stegen.

Uppdatering- How to har tagits bort som snippet av Google.

Author - Google har de senaste åren arbetat mycket med att innehåll ska ha en trovärdig källa vilket oftast är en författare. Hela deras EEAT-algorithm bygger på trovärdigheten bakom innehåll. När man bygger upp ramverket för att publicera artiklar bör man ha författarskapet i åtanke och använda sig av author med person som property. Nästa steg är att använda specifika författarsidor och sedan använda även author URL för att skapa en relation mellan artikeln och författarsidan.

Breadcrumbs**: **Även brödsmulor är något de flesta sidor (bör) använda. Scheman för brödsmulor berättar tydligt hur taxonomin av sidor ser ut.

FAQ**: **Att arbeta med frågor och svar är en effektiv metod att synas på long tails och denna implementering visar upp frågor och svar direkt i sökresultatet.

Uppdatering - FAQ-snippets har tagits bort av Google från de flesta hemsidor men visas på "for well-known, authoritative government and health websites. "

Video**: **Genom att markera upp sina videos kommer de att synas direkt i Googles sökresultat, video sökresultat, Google Images, och Google Discover.

Pending - Några Eventuellt kommande uppdateringar

På schema.org finns blåmarkerade rader, dessa ligger som pending och är förslag som ska godkännas innan de blir kompletta uppmärkningar. Men väl värda att hålla ögonen på. Nedan är några jag ansåg intressanta.

Guide Internet är fullt av guider. Det finns How-to schema men inte en schema för en köp-relaterad guide. I dagsläget är beskrivningen "Guide är en sida eller artikel som rekommenderar specifika produkter eller tjänster, eller aspekter av en sak som en användare bör överväga. En guide kan representera en köpguide med detaljer om produkter eller tjänster som en användare kan överväga. En guide kan representera en produktguide och rekommendera specifika produkter eller tjänster. En guide kan representera en rankad lista och rekommendera specifika produkter eller tjänster med ranking.

BioChemEntity- Arbetar man med någon typ av biologisk, biokemisk eller kemisk produkt är BioChemEntity en väldigt intressant type som ligger som pending där det finns en hel del properties för att definiera vilken typ av kemisk substans/produkt det rör sig om. Här är projektet för bioschemas. https://bioschemas.org/

DiversityPolicy. Som det låter, uppmärkning för ett företags mångfaldsplan.

Terminologi och förväxlingar inom strukturerad data och schema

Det sker ibland förväxlingar mellan begrepp och terminologi.

**Schema markup: **Schema markup refererar till användningen av strukturerad data som läggs till i webbsidor för att ge ytterligare kontext och förståelse åt sökmotorer och andra automatiserade system. Detta görs genom att använda ett specifikt märkspråk, vanligtvis schema.org, som definierar en uppsättning standardiserade märkningar eller taggar för olika typer av innehåll.

Strukturerad data: Strukturerad data är ett bredare begrepp som refererar till en typ av dataorganisation där informationen är organiserad och presenterad på ett sätt som gör att den kan tolkas och bearbetas av datorer. Det handlar om att använda en enhetlig struktur, till exempel tabeller, listor eller hierarkier, för att representera och lagra data. Strukturerad data kan förekomma i olika format, inklusive databaser, Excel-ark, JSON och XML. Genom att använda strukturerad data kan informationen sorteras, filtreras och analyseras mer effektivt.

Rich snippets är ett resultat av vissa typer av schema markup där Google premierar en korrekt implementation och visar upp mer information kopplat till sökresultatet.

Featured snippets har inte direkt att göra med strukturerad data eller schema, utan är en särskild sökträff som Google visar högst upp i sökresultatet. Sökträffen per se har inte att göra med schema markup men om de gynnas på något indirekt sätt låter jag vara osagt.

Microdata är en alternativ metod att implementera schema med html-taggar direkt i koden.

Sitelinks är det länkar man får under sitt sökresultat. Huruvida man får sitelinks eller inte avgör Googles algoritm och har antagligen inte (direkt) att göra med strukturerad data men om man får en så kallad sitelinksearch box, en sitelink med en sökruta i, går det att modifiera sökrutan så att den leder trafiken rätt in till en webbsida istället för att det sker en site:sök som enbart listar sökträffarna direkt i Google.

Knowledge graph är sökmotorers egna kunskapsdatabas som används för att skapa sökresultat.

Knowledge panels är de stora delar som idag dyker upp till vänster ofta förknippade med varumärken. De går direkt att påverka med strukturerad data men de dyker ibland upp ändå.

Det finns flera metoder att implementera schema men den vanligaste och rekommenderade är JSON-LD. Men det går även att använda sig av microdata och RDFa. Fördelen med J:son är att scripten blir strukturerad på en del av sidan.

Sammanfattning

Schema markup är en standardiserad metod att strukturera upp data.
Schema.org uppdateras i en allt större omfattning och takt.
Schema markup används i allt större omfattning av sökmotorer för att ett: Förstå innehåll på en webbplats och två: presentera innehåll från en webbplats.
Både Bard och Chat GPT 4 förstår schema markup.
Om man inte arbetar aktivt med schema markup ligger man redan efter.
Jag tror schema markup kommer att få en allt större betydelse för en webbplats synlighet.