Package inputenc Error: Unicode char � (U+80)(inputenc) not set up for use with LaTeX.

Qual é o problema?

Ao processar o ficheiro aparecem erros do género:

Package inputenc Error: Unicode char � (U+80)(inputenc) not set up for use with LaTeX.
Package inputenc Error: Unicode char � (U+93)(inputenc) not set up for use with LaTeX.
Package inputenc Error: Unicode char � (U+99)(inputenc) not set up for use with LaTeX.
Package inputenc Error: Unicode char � (U+99)(inputenc) not set up for use with LaTeX.
Package inputenc Error: Unicode char � (U+80)(inputenc) not set up for use with LaTeX.
Package inputenc Error: Unicode char � (U+93)(inputenc) not set up for use with LaTeX.
Package inputenc Error: Unicode char − (U+2212)(inputenc) not set up for use with LaTeX.


Qual é a génese do problema?

Todos os caracteres têm um código associado e, muitos deles, têm também uma representação visual associada (mas não todos).  Por exemplo, o caráter com a representaçao '@' tem o código U+0040. O caráter 'ņ' (sim… um n com uma vírgula por baixo) tem o código U+0146, o 'غ' tem o código U+063A, e até o '😀' tem o código U+1F600.

Com uma pesquisa no Google é fácil achar várias tabelas com os códigos Unicode dos caracteres.  Vejam por exemplo em https://unicode-table.com/pt/, que apresenta uma tabela com muuuuitos caracteres, a sua representação visual (para os que têm) e o respetivo código.  

Alguns dos códigos (por exemplo os primeiros, e.g., U+0002) têm umas letras dentro de uma caixa a tracejado, estes caracteres existem por questões técnicas mas não têm representação visual imediata.  

Qual é a questão com o LaTeX?

Normalmente, um texto em LaTeX pode ter apenas um subconjunto deste universo gigantesco de caracteres. Por exemplo, se se colocar um emoji no meio do texto em LaTeX, ao processá-lo obter-se-á um erro semelhante ao apresentados acima.

Mas eu não vejo caracteres "estranhos" no meu texto!

Pode acontecer que sejam caracteres não visíveis, ou pode acontecer que seja um visível mas parecido com um mais "normal" e, por isso, passar despercebɨdo! 😏

Pode haver várias formas de introduzir estes caracteres no texto, mas a mais frequente é por  copy & paste de outros documentos, da Web ou de um PDF.  Os gestores de bibliografia (Zotero, Mendeley, etc) são também grandes fontes de texto com caracteres inválidos (para o LaTeX), pois importam/geram as referência a partir de ficheiros PDF e depois não "limpam" o texto gerado automaticamente antes de exportarem em formato BIB.  O resultado é um ficheiro BIB com caracteres inválidos.

Como resolver?

Removendo os caracteres inválidos!  

E como consigo remover os caracteres inválidos?

Uma forma fácil é usando o serviço acessível neste link….
que irá transformar os caracteres inválidos em '_' (ou outro à escolha).  Depois é procurar as ocorrências do caráter escolhido e apagá-las.

Bom LaTeX!

Comentários

Mensagens populares deste blogue

Como forçar uma nova linha dentro de uma tabela?

Sobre o posicionamento de figuras e tabelas no documento

Gráfico ou Tabela?