Identifique localizações brasileiras em um texto 🏘
Project description
tomba
Identifique endereços, bairros e outras localizações brasileiras em um texto. 🏘
Não sabe o que é o Tomba?
Essa biblioteca é experimental e está no seu estágio inicial de desenvolvimento.
Objetivo:
import tomba
tomba.get_locations(
"Contratação de empresa de engenharia para executar obras "
"de pavimentação localizados no CEP 44100-000, no bairro Tomba."
)
Saída:
[
{"type": "zipcode", "start": 92, "end": 123},
{"type": "neighborhood", "start": 113, "end": 118}
]
Desenvolvimento
Utilizamos o poetry para empacotamento e gerenciamento das dependências.
Para instalar as dependências, execute poetry install
.
Para configurar o spacy em português, execute:
poetry run python -m spacy download pt_core_news_sm
Para rodar os testes:
poetry run pytest
Para gerar um novo modelo:
poetry run python tomba/models.py
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
tomba-0.1.1a1.tar.gz
(16.1 kB
view details)
Built Distribution
tomba-0.1.1a1-py3-none-any.whl
(17.0 kB
view details)
File details
Details for the file tomba-0.1.1a1.tar.gz
.
File metadata
- Download URL: tomba-0.1.1a1.tar.gz
- Upload date:
- Size: 16.1 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: poetry/1.1.4 CPython/3.8.5 Linux/4.19.104-microsoft-standard
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | b6de9955d9b94492767d0c67529597f74163f5a359cc65793b9d95502f2717bb |
|
MD5 | e0ce701b0265a18d757429eee15654ff |
|
BLAKE2b-256 | 818f260720aec70add0a98c05c7ecec2cd5486ec3bcf3b05f397a0222621518a |
File details
Details for the file tomba-0.1.1a1-py3-none-any.whl
.
File metadata
- Download URL: tomba-0.1.1a1-py3-none-any.whl
- Upload date:
- Size: 17.0 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: poetry/1.1.4 CPython/3.8.5 Linux/4.19.104-microsoft-standard
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | f8feaa9e454eef1d41d27ef6ad509e26e973f54b43008ca650f061481d851ee5 |
|
MD5 | bdbb727be191934bdf2cedcc74092436 |
|
BLAKE2b-256 | efd46d2e487c229ec7beecf482d9fa77f114ee68680797dfffda14e7e931ef11 |