$ awk 'substr($2, 1, ol) != o { print x } { o = substr($2, 1, ol = length($2) - 5); x = $0 } END { print x }' input 1 bewilligung%20f%C3%BCr%20kollektoren.html 1 bewilligung%20f%C3%BCr.html 1 bewilligung%20f.html 1 bewilligung%20selbstdispensaton.html 2 bewilligung%20solar.html 3 bewilligung.html 1 bewirtung.html 1 bezahte%20.html 2 bezahte.html 1 bid.html 3 bienen.html 1 biildungsdirektion.html 1 bildungsrat.html 1 bildungsstatistik.html 2 billettsteuer.html 1 bir.html 1 biz%20winterthur.html 1 biz.html 1 bodenver.html 1 bonset.html 1 bonstetten%20oo.html 1 bonstetten%20posten.html 1 bonstettenn.html 1 bpg.html 1 brandchutz.html 1 brandschutz%20nachweis.html 2 brandschutz%20parkh\xe4user.html 4 brandschutz.html 1 bruttogeschlo.html 2 bruttogeschossfl\xe4che.html 1 budget.html 1 burgen.html 1 bussen%20verwendung.html 1 bussen.html