Giter VIP home page Giter VIP logo

poetisa's Introduction

POeTiSA is a long term project that aims at growing syntax-based resources and developing related tools and applications for Brazilian Portuguese language, looking to achieve world state-of-the-art results in this area. On the resource side, we focus on the production of a large and comprehensive multi-genre corpus of Universal Dependencies-based part of speech and syntactically annotated texts, including mainly news texts and user-generated content (tweets and online comments). Regarding the tools, we aim to investigate recent neural and distributional-based methods for training robust parsing models for Portuguese. The project also envisions the production of applications on opinion mining and sentiment analysis tasks that may benefit from syntactic knowledge, as opinion summarization, helpfulness prediction, aspect identification, deception detection and emotion classification.

This project is part of the Natural Language Processing initiative (NLP2) of the Center for Artificial Intelligence (C4AI) of the University of São Paulo, sponsored by IBM and FAPESP (grant #2019/07665-4). The center is part of the FAPESP Engineering Research Centers Program and is committed to state-of-the-art research in Artificial Intelligence, exploring both foundational issues and applied research.

More information about the project may be found at https://sites.google.com/icmc.usp.br/poetisa

poetisa's People

Contributors

ud-portugues avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar

poetisa's Issues

Erro de pré-processamento

Olás!!

Pessoal, eu estou com dúvida na frase "Quais seleções já estão classificadas para a Copa de o Mundo de a Rússia-2018 " Esse (RUSSIA-2018) é erro de pré-processamento? Eu fui procurar a frase na internet e tive várias respostas diferentes...

Inté

Erros de Digitação

Na seguinte frase ' "Tigresa", honra ou insulta as mulheres.', claramente está faltando uma crase para fazer sentido.
Eu coloco esse "as" como determinante ou ERRO_DE_DIGITACAO?

Preposicões anotadas com SCONJ

Sempre que uma preposição introduz uma oração subordinada, recebe a etiqueta SCONJ. Nesses casos, a preposição é sempre seguida de verbo no infinitivo. Se tiverem exemplos desse tipo que gerem dúvidas, comentem aqui.

Dúvida

Oi, pessoal, tudo bem?

Me surgiu uma dúvida que na verdade não faz bem parte das POS tags... Vou tentar explicar. na frase:
-----------------------(amod->)
(170) Há outras aparentes boas notícias em a pesquisa , ainda de acordo com Angélico .
-------------------(NOUN) (ADJ) (NOUN)

A parte acho que é sintática, tem uma relação de amod indo de "aparentes" para "boas" , e, me parece que a relação deveria ser entre boas e notícias,(certo ?)

Enfim, desculpa se pergunta é meio boba ou fora da minha alçada, mas fiquei com isso na cabeça. (^^')

Etiqueta para "cujo"

Os requerentes cujos pedidos sejam rejeitados seriam devolvidos a seus países de origem .
DÚVIDA: "cujos" pode ser anotado como DET ou PRON? o que vocês acham?

Usos diferentes de "que"

Na seguinte sentença:
"Que tanta história de suas vidas meninos e meninas ainda em flor teriam para contar?"

Esse "que" parece com "quantas" em: "Quantas tantas histórias eles têm para contar?"

Mas "que" pode ser advérbio?

Adjetivos x Substantivos

Eu tenho a seguinte dúvida, se anoto como NOUN ou ADJ nas seguintes sentenças:
"Se os valores de sete anos atrás não se mostravam sustentáveis, tampouco os atuais devem ser considerados definitivos"

  • "atuais" está qualificando valores, na oração anterior, mas no caso é anotado como NOUN, certo?

E como fica no seguinte caso:
"Se perder para o Brasil, pode terminar em sétimo".

  • nesse caso, "sétimo" está qualificando um substantivo elíptico "lugar" e por isso é adjetivo, certo?

Então só anoto como NOUN quando há o artigo?

Advérbios x Determinantes

A palavra "mais" normalmente é advérbio.
Mas em alguns casos ela pode ser pronomial indefinido, como em:
"O cenógrafo precisou de mais luz." e "Temos projeto para dar apoio em a integração de mais imigrantes"

Nesses casos, a palavra "mais" é anotada como determinante, certo?

(Obs.: Eu não estou conseguindo colocar label nas minhas issues gente, não aparece nada para mim.)

Discussão e dúvidas corpus DANTE

Conforme combinado na reunião do grupo de anotação do corpus de tweets DANTE, criei o issue para o registro de discussões e dúvidas em relação ao corpus DANTE

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.