Giter VIP home page Giter VIP logo

Comments (5)

leoalenc avatar leoalenc commented on August 23, 2024 1

@leoalenc , analisei cuidadosamente cada uma das 15 sentenças que achei que continham erro. De fato, todas seguem os princípios que você descreveu com relação às aspas duplas nos valores do atributo text_eng. Tenho apenas dois questionamentos antes de fechar a issue:

  1. A primeira sentença da minha lista (Avila2021:29:3:332) de quinze sentenças deveria conter o travessão no início do valor do atributo text? Ou seja, deveria ser assim # text = ― Eré, se ruayara. sendo que atualmente temos # text = Eré, se ruayara.?

Corrigido com 2ad9059. Obrigado, @heliolbs .

  1. Há algum motivo para os valores do atributo text_eng não usarem também o travessão como temos em text, text_por etc.?

https://dictionary.cambridge.org/grammar/british-grammar/reported-speech-direct-speech

https://www.bbc.co.uk/bitesize/articles/zqmwg7h#:~:text=Punctuation%20is%20used%20in%20direct,inverted%20commas%20or%20quotation%20marks.

from nheengatu.

leoalenc avatar leoalenc commented on August 23, 2024

@heliolbs , obrigado por levantar esta questão. na verdade, não se trata de erro. É que as sentenças em questão constituem partes de falas ou turnos conversacionais de personagens. Não se trata de sentenças isoladas, como se pode depreender da numeração no atributo sent_id. Por exemplo, em Avila2021:29:3:332, temos o início da fala, assinalado pelo travessão em português, concluída em Avila2021:29:4:333.

Sobre esse sistema de numeração, consultar:

https://aclanthology.org/2024.propor-2.8/

Você poderia verificar se os exemplos que apontou seguem essa lógica? Caso afirmativo, você poderia fechar a questão.

from nheengatu.

leoalenc avatar leoalenc commented on August 23, 2024

Prompt to ChatGPT4.0:

Please create a markdown table explaining the rationale behind the numbers of the sent_id attributes of the two Nheengatu UD treebank examples:

# sent_id = Casasnovas2006:7:1:1
# text = Yepé ara paá taína-itá taunheẽ ta ramunha tamakwarí tuyué supé: — Abú, puxiwera paá marandua yandé.
# text_eng = One day, they say, children said to their grandfather, old Tamaquari: "Grandpa, we have bad news.
# text_por = Um dia, contam, crianças disseram para o seu avô, o velho Tamaquari: — Vovô, temos uma má notícia. [Adapt. transl.]

# sent_id = Casasnovas2006:7:2:2
# text = Kwá iwí paá yepé ara ukái arã yané irumu!
# text_eng = The world, they say, will one day burn with us!"
# text_por = O mundo, dizem, um dia queimará conosco! [Avila 2021]

Result of my correction of the table created by ChatGPT (the given example is a unfortunate since it does not represent the prototypical case where Author0000:1:1:1 is sentence 1 of text 1 and sentence 1 of Author's collection, which seems to explain the mistakes by the AI):

Attribute Explanation
Source The prefix Casasnovas2006 indicates the source of the sentence, which is a reference to a work by Casasnovas from 2006.
Text Number The number 7 specifies the text number in the source document where the sentence can be found.
Sentence Number The numbers 1 and 2 indicate the position of the sentence within the specified text.
Collection Number The final number in the sent_id (e.g., 1 or 2) indicates the position of the sentence within the specified collection, i.e., Casanovas'.

@heliolbs , veja se está claro agora.

from nheengatu.

heliolbs avatar heliolbs commented on August 23, 2024

heliolbs , obrigado por levantar esta questão. na verdade, não se trata de erro. É que as sentenças em questão constituem partes de falas ou turnos conversacionais de personagens. Não se trata de sentenças isoladas, como se pode depreender da numeração no atributo sent_id. Por exemplo, em Avila2021:29:3:332, temos o início da fala, assinalado pelo travessão em português, concluída em Avila2021:29:4:333.

Entendido, @leoalenc .

Você poderia verificar se os exemplos que apontou seguem essa lógica? Caso afirmativo, você poderia fechar a questão.

Posso sim verificar se a lógica está sendo seguida nos quinze exemplos. Dou retorno em breve.

heliolbs , veja se está claro agora.

Sim, ficou mais claro agora.

from nheengatu.

heliolbs avatar heliolbs commented on August 23, 2024

@leoalenc , analisei cuidadosamente cada uma das 15 sentenças que achei que continham erro. De fato, todas seguem os princípios que você descreveu com relação às aspas duplas nos valores do atributo text_eng. Tenho apenas dois questionamentos antes de fechar a issue:

  1. A primeira sentença da minha lista (Avila2021:29:3:332) de quinze sentenças deveria conter o travessão no início do valor do atributo text? Ou seja, deveria ser assim # text = ― Eré, se ruayara. sendo que atualmente temos # text = Eré, se ruayara.?

  2. Há algum motivo para os valores do atributo text_eng não usarem também o travessão como temos em text, text_por etc.?

from nheengatu.

Related Issues (20)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.