Wasserstand #2: Sisyphos lässt das Jahr 2006 hinter sich
Alexander Trust, den 15. Januar 2020Geschafft. Auch kleine Schritte sind ein Zeichen dafür, dass etwas vorangeht. Immerhin weiß ich, dass wir für das Projekt Zeit brauchen. Entsprechend mache ich nun zumindest unter das Jahr 2006 einen Haken. Ich konnte gestern eine erste Drübersicht abschließen, damit auch das Jahr 2006 vorerst zu den Akten legen.
Im Footer steht aber 1998?
Macnotes selbst wurde 2006 gegründet. „Ich“ betrieb Webseiten aber schon seit 1998. Einige der Inhalte werden auch in dieses Projekt einfließen.
Doch zunächst möchte ich auf Macnotes in den Artikeln eine Konsistenz entwickeln. Entsprechend fange ich hinten an, und arbeite mich chronologisch nach vorn vor.
Was bedeutet Konsistenz?
Ich überarbeite die Artikel in vielerlei Hinsicht. Dazu zählt zum Beispiel, dass die Beiträge auch passende Artikelbilder haben, dass alte Links noch funktionieren, Videos, Podcasts oder andere Audioaufzeichnungen sichtbar sind, sowohl für Leser als auch für den Knowledge Graph.
Ich folge also zum Beispiel den Links von damals, auch den internen, und korrigiere sie. Das mache ich mit Hilfe von SQL wie folgt:
UPDATE wp_posts
SET post_content = replace(post_content, 'https://macnotes.de/2006/12/30/hinter-den-kulissen-von-filevault/', 'https://macnotes.de/2006/12/30/hinter-den-kulissen-von-filevault/');
In diesem Fall wurde einfach nur das http gegen ein https getauscht. Doch es gibt auch andere Fälle, in denen ein Artikel gelöscht wurde und weiterleitet. Entsprechend wird dann der alte durch den neuen ersetzt. Oder ein externer Link ist tot und ich verlinke dann auf das Webarchiv, oder, oder…
Effizienter geht immer
Nun könntet Ihr denken, warum wandelt er nicht direkt alle Links von http zu https um. Das könnte ich tun. Einerseits ist das aber nicht das einzige Problem. Andererseits würde das aber meine Arbeit nur erschweren.
Denn derzeit ist bei meiner Vorgehensweise auch das „https“ ein Signal dafür, dass ich einen internen Link bereits überarbeitet habe. Das bietet mir ein Gefühl von Sicherheit und ich muss weniger klicken, um zu überprüfen ob ich denn den Link bereits bearbeitet habe. Dabei hilft mir auch, dass ich „jeden“ Link öffne und damit dann in Zukunft eine andere Linkfarbe im Editor angezeigt bekomme, da ich den Link bereits „visited“ habe. Ein optischer Indikator.
Videocodes veraltet
Ein weiterer Aspekt, auf den beispielsweise die Search Console von Google hinweist, sind fehlerhafte Videoeinbindungen. Meist versteckt sich dahinter ein alter Artikel, in dem Videos noch per Flash eingebunden wurden, weil man es damals so machte. Ich suche dann nach einer Alternative. Manchmal kommt es dann leider auch vor, dass gar kein Video mehr enthalten ist, weil es die Inhalte von damals heute nicht mehr gibt.
Interne Links
Es gibt aber noch einen Grund, warum ich „hinten“ anfange. Denn ich möchte in neueren Artikeln auf alte Artikel verlinken. Nun bin ich nicht Manni Ludolf und kenne deshalb wirklich nicht alle über 35.000 Texte von Macnotes. Aber ich kenne einige, alleine schon weil ich knapp ein Drittel davon selbst geschrieben habe und durch meine Arbeit an der Webseite kenne ich dann immer mehr.
Die interne Verlinkung in einer Webseite ist wichtig. Wichtig für den Leser aber auch für die Suchmaschine. Also mache ich diese Arbeit nicht umsonst.
Schlagwortchaos beseitigen
In den letzte Jahren unter Fliks versuchte ich bereits „aufzuräumen“. Seinerzeit habe ich Schlagwörter reduziert, bzw. neue, unsichtbare „Keywords“ dazu gepackt. Autoren versuchte ich dazu zu bringen, doch das neue System zu nutzen. Dann kam die Übernahme durch WakeUp. In der ersten Zeit arbeitete ich dort noch mit, doch später nicht mehr. Was folgten, waren Autoren, die nichts von „meinem“ System wussten, und also gibt es nun wieder zehntausende Schlagwörter – was ein Unsinn und daneben aber auch viele viele unsichtbare „Keywords“.
Ich wurde damals nicht fertig mit der Überarbeitung der Schlagwörter. Ich mache heute aber damit weiter. Warum? Eine Webseite braucht nicht 40.000 Unterseiten, auf denen zum Teil kaum Inhalte zu finden sind. Das findet übrigens auch Google. Denn selbst der Suchmaschinenanbieter musste verstehen, dass Ressourcen endlich sind und also könnt Ihr in der Search Console einen Teil Eurer Webseite als „nicht indexiert“ sehen. Je nachdem, wie gut Google die eigene Seite findet, bzw. wie inhaltsleer die übrigen Seiten sind, ist der Teil kleiner oder größer.
Schon deshalb habe ich die „unsichtbaren“ Keywords eingeführt, mit denen man zwar Plug-ins oder eigene Methoden im Template bedienen kann, um ähnliche Artikel zu suchen, oder dergleichen.
Datengestützter Journalismus
Wenn ich mit dem Aufräumen fertig bin, wird die Seite hoffentlich deutlich mehr Struktur haben. Das ist wichtig. Denn sie soll schließlich mit noch weiteren Projekten zusammengeführt werden, teils aus neuer Akquise. Und auch die Portierung der Daten auf ein anderes, vielleicht auch eigenes CMS wird dadurch erheblich erleichtert. Nicht zuletzt gefällt es Google und anderen Suchmaschinen, wenn sie eine Struktur erkennen.
Vor allem aber hilft diese Struktur uns selbst. Denn unser Ziel ist langfristig einen Journalismus zu etablieren, der von Big Data gestützt wird, wo wir Nachrichten aus Fakten schaffen. Wenn aber die eigenen Daten nur Kraut und Rüben sind, kann man sie nicht entsprechend auswerten.
Vielen Dank fürs Lesen und bis zum nächsten Wasserstand.
Ergänzung zu Ludolf
Aus gegebenem Anlass. Da viele IBES-Gucker auf diesen Artikel aufmerksam wurden. Es ist nicht „Manni Ludolf“, der auf RTL erwähnt wurde. Vielmehr ist Kameramann Manfred „Manni“ Friebe gestorben.
Weitere Teile der Reihe Wasserstand
- Wasserstand #19: Neue Funktionen, 2020 geschafft, 2009 auch
- Wasserstand #18: Sich selbst auf die Schulter klopfen und die Trennung von Pagespeed
- Wasserstand #17: WordPress bändigen, Links korrigieren, Rückschläge verdauen
- Wasserstand #16: Es geht wieder weiter
- Wasserstand #15: Aderlass, Abmahnung, Rebounce und Durststrecke
- Wasserstand #14: Phishing, die Post und der größte Müll
- Wasserstand #13: Lottogewinn, Pr0n 09/2008 und Fake-Anfragen
- Wasserstand #12: PHP, Javascript und viel Arbeit
- Wasserstand #11: Der Newsletter mit Corona
- Wasserstand #10: Eigene Dummheiten, erste Tests und mehr
- Wasserstand #9: Der Juni mit Erkenntnissen?!
- Wasserstand #8: Spock, Schneeleopard und Toilettenpapier
- Wasserstand #7: Thin Content, Dubletten und Ideen für die Zukunft von Macnotes
- Wasserstand #6: Sichtbarkeit, Sichtbarkeit und Unsichtbarkeit
- Wasserstand #5: Deutschkurs für Anfänger und die Fusion zweier Webseiten
- Wasserstand #4: CeBit 2008 und richtungsweisende Entscheidung
- Wasserstand #3: Grippe, 2007, Sichtbarkeit und Besucher
- Wasserstand #1: Neues Jahr, viel zu tun