Přímá cesta asi nebude, ale pro začátek by mi stačilo něco, co převede PDF na TXT a rozseká to zároveň na kapitoly podle nadpisů nebo podle obsahu.
Kdyby to navíc umělo:
- Vyházet čísla stránek,
- odstranit poznámky pod čarou,
- napojit text z konce stránky na začátek následující stránky,
pak by to bylo úplně super
Nemusí to být free. Pokud mi to ušetří manuální práci, nemám problém zaplatit
Konverze takto vyčištěného textu do audia už je trivka:
Kód: Vybrat vše
say -v Zuzana -f vstup.txt -o vystup.mp3
Kód: Vybrat vše
for kapitola in `ls`; do say -v Zuzana -f vstup-$kapitola.txt -o vystup-$kapitola.mp3; done