LibreOffice Calc: Jak najít a smazat všechny duplicitní řádky?

Dnes jsem řešil problém, kdy jsem měl seznat asi 30 tisíc položek, kde některé byly dvakrát. Ty jsem chtěl smazat. Návody na internetu často navrhují data seřadit a následně ručně duplikáty smazat. To se mi moc nelíbilo, a tak jsem šel trochu jinou cestou, kterou následně ukážu:

1) Nejprve máme prázdný dokument:

Screenshot 2014-05-16 18.57.32

 

2) V něm je seznam položek. V příkladu je položka Produkt 1 duplicitní a chceme ji odstranit.

Screenshot 2014-05-16 18.59.54

3) Nejprve si musíme všechny položky seřadit podle pole, podle kterého chceme rozpoznat duplicitní položky (v tomto případě je to název).

Screenshot 2014-05-16 19.00.00 Screenshot 2014-05-16 19.00.05 Screenshot 2014-05-16 19.00.09 Screenshot 2014-05-16 19.00.22

4) Nyní, když položky máme seřazené, tak začneme kouzlit:

Přidáme další sloupec, já jsem ho pojmenoval Duplikat?. Název není ale vůbec důležitý. Do řádku, kde máme první data, napíšeme následující formuli:

=IF(A2=A3;1;0)

Co to znamená? Vezmi hodnotu A2 (Produkt 1) a hodnotu A3 (Podukt 1). Když se A2 rovná A3, napiš 1. Jinak napiš 0. Možná budete muset zvolit jiné písmeno, je to písmeno sloupce, podle kterého vyhledáváte duplicity.

Screenshot 2014-05-16 19.01.03

5) V dalším kroku tuto funkci rozšíříme pro celý sloupec (klasicky vybereme první řádek a myší chytneme ten malý černý čtverec, který je vlevo dole a posuneme ho dolů).

Screenshot 2014-05-16 19.01.14 Screenshot 2014-05-16 19.01.19

6) A máme identifikované duplicity. Nyní je musíme vyfiltrovat, abysme je mohli smazat. Na to se hodí nástroj Automatický filtr.

Screenshot 2014-05-16 19.01.30

7) Nyní když máme aktivovaný automatický filtr, tak si vyfiltrujeme pouze řádky, které mají ve sloupci Duplikat hodnotu 1.

Screenshot 2014-05-16 19.01.36 Screenshot 2014-05-16 19.01.49

8) A nyní tyto položky můžeme odstranit. Nyní vypneme automatický filtr, případně znovu data seřadíme podle libosti. Duplikáty jsou pryč.

Screenshot 2014-05-16 19.02.28

2 komentáře u „LibreOffice Calc: Jak najít a smazat všechny duplicitní řádky?

  1. Marek Hnátek

    Zdravím,
    uvedený postup bude fungovat pouze u položky Produkt 1? Viz „Vezmi hodnotu A2 (Produkt 1) a hodnotu A3 (Podukt 1). Když se A2 rovná A3, napiš 1. Jinak napiš 0.“. Má Calc jednodušší způsob odstranění duplicit, něco jako má Excel?

  2. Lukáš Hrubý Autor příspěvku

    Polozky jsou serazene a IF podminka kontroluje, jestli je prvek na aktualnim radku stejny, jako ten na radku predchozim. Najde to tedy vsechny duplicity (vsech (v tomto pripade) produktu).

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Můžete používat následující HTML značky a atributy: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>