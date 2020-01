Geschafft. Auch kleine Schritte sind ein Zeichen dafür, dass etwas vorangeht. Immerhin weiß ich, dass wir für das Projekt Zeit brauchen. Entsprechend mache ich nun zumindest unter das Jahr 2006 einen Haken. Ich konnte gestern eine erste Drübersicht abschließen, damit auch das Jahr 2006 vorerst zu den Akten legen.

Im Footer steht aber 1998?

Macnotes selbst wurde 2006 gegründet. „Ich“ betrieb Webseiten aber schon seit 1998. Einige der Inhalte werden auch in dieses Projekt einfließen.

Doch zunächst möchte ich auf Macnotes in den Artikeln eine Konsistenz entwickeln. Entsprechend fange ich hinten an, und arbeite mich chronologisch nach vorn vor.

Was bedeutet Konsistenz?

Ich überarbeite die Artikel in vielerlei Hinsicht. Dazu zählt zum Beispiel, dass die Beiträge auch passende Artikelbilder haben, dass alte Links noch funktionieren, Videos, Podcasts oder andere Audioaufzeichnungen sichtbar sind, sowohl für Leser als auch für den Knowledge Graph.

Ich folge also zum Beispiel den Links von damals, auch den internen, und korrigiere sie. Das mache ich mit Hilfe von SQL wie folgt:

UPDATE wp_posts SET post_content = replace(post_content, 'http://www.macnotes.de/2006/12/30/hinter-den-kulissen-von-filevault/', 'https://macnotes.de/2006/12/30/hinter-den-kulissen-von-filevault/');

In diesem Fall wurde einfach nur das http gegen ein https getauscht. Doch es gibt auch andere Fälle, in denen ein Artikel gelöscht wurde und weiterleitet. Entsprechend wird dann der alte durch den neuen ersetzt. Oder ein externer Link ist tot und ich verlinke dann auf das Webarchiv, oder, oder…

Effizienter geht immer

Nun könntet Ihr denken, warum wandelt er nicht direkt alle Links von http zu https um. Das könnte ich tun. Einerseits ist das aber nicht das einzige Problem. Andererseits würde das aber meine Arbeit nur erschweren.

Denn derzeit ist bei meiner Vorgehensweise auch das „https“ ein Signal dafür, dass ich einen internen Link bereits überarbeitet habe. Das bietet mir ein Gefühl von Sicherheit und ich muss weniger klicken, um zu überprüfen ob ich denn den Link bereits bearbeitet habe. Dabei hilft mir auch, dass ich „jeden“ Link öffne und damit dann in Zukunft eine andere Linkfarbe im Editor angezeigt bekomme, da ich den Link bereits „visited“ habe. Ein optischer Indikator.

Videocodes veraltet

Ein weiterer Aspekt, auf den beispielsweise die Search Console von Google hinweist, sind fehlerhafte Videoeinbindungen. Meist versteckt sich dahinter ein alter Artikel, in dem Videos noch per Flash eingebunden wurden, weil man es damals so machte. Ich suche dann nach einer Alternative. Manchmal kommt es dann leider auch vor, dass gar kein Video mehr enthalten ist, weil es die Inhalte von damals heute nicht mehr gibt.

Interne Links

Es gibt aber noch einen Grund, warum ich „hinten“ anfange. Denn ich möchte in neueren Artikeln auf alte Artikel verlinken. Nun bin ich nicht Manni Ludolf und kenne deshalb wirklich nicht alle über 35.000 Texte von Macnotes. Aber ich kenne einige, alleine schon weil ich knapp ein Drittel davon selbst geschrieben habe und durch meine Arbeit an der Webseite kenne ich dann immer mehr.

Die interne Verlinkung in einer Webseite ist wichtig. Wichtig für den Leser aber auch für die Suchmaschine. Also mache ich diese Arbeit nicht umsonst.

Schlagwortchaos beseitigen

In den letzte Jahren unter Fliks versuchte ich bereits „aufzuräumen“. Seinerzeit habe ich Schlagwörter reduziert, bzw. neue, unsichtbare „Keywords“ dazu gepackt. Autoren versuchte ich dazu zu bringen, doch das neue System zu nutzen. Dann kam die Übernahme durch WakeUp. In der ersten Zeit arbeitete ich dort noch mit, doch später nicht mehr. Was folgten, waren Autoren, die nichts von „meinem“ System wussten, und also gibt es nun wieder zehntausende Schlagwörter – was ein Unsinn und daneben aber auch viele viele unsichtbare „Keywords“.

Ich wurde damals nicht fertig mit der Überarbeitung der Schlagwörter. Ich mache heute aber damit weiter. Warum? Eine Webseite braucht nicht 40.000 Unterseiten, auf denen zum Teil kaum Inhalte zu finden sind. Das findet übrigens auch Google. Denn selbst der Suchmaschinenanbieter musste verstehen, dass Ressourcen endlich sind und also könnt Ihr in der Search Console einen Teil Eurer Webseite als „nicht indexiert“ sehen. Je nachdem, wie gut Google die eigene Seite findet, bzw. wie inhaltsleer die übrigen Seiten sind, ist der Teil kleiner oder größer.

Schon deshalb habe ich die „unsichtbaren“ Keywords eingeführt, mit denen man zwar Plug-ins oder eigene Methoden im Template bedienen kann, um ähnliche Artikel zu suchen, oder dergleichen.

Datengestützter Journalismus

Wenn ich mit dem Aufräumen fertig bin, wird die Seite hoffentlich deutlich mehr Struktur haben. Das ist wichtig. Denn sie soll schließlich mit noch weiteren Projekten zusammengeführt werden, teils aus neuer Akquise. Und auch die Portierung der Daten auf ein anderes, vielleicht auch eigenes CMS wird dadurch erheblich erleichtert. Nicht zuletzt gefällt es Google und anderen Suchmaschinen, wenn sie eine Struktur erkennen.

Vor allem aber hilft diese Struktur uns selbst. Denn unser Ziel ist langfristig einen Journalismus zu etablieren, der von Big Data gestützt wird, wo wir Nachrichten aus Fakten schaffen. Wenn aber die eigenen Daten nur Kraut und Rüben sind, kann man sie nicht entsprechend auswerten.

Vielen Dank fürs Lesen und bis zum nächsten Wasserstand.