Giter VIP home page Giter VIP logo

structured-law-document's People

Contributors

chuan6 avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar

structured-law-document's Issues

[体育法] 目录里条区间的罗列

体育法第八章(附则)包含了三条,第五十五、五十六、四十七条。第四十七条已无效,仅被包含与文本以供参考。

目前算法将第八章的条数区间识别为“条55-47”,可能引起误会。

方案:识别章节第一条的条数作为区间起始,而后识别该章节中最大的条数,作为区间的结束。在体育法第八章里,应该识别出“条55-56”。

为目录项添加相关条

使查找条目时更简便,少翻页。

  • 序言,或其他不还有条款的目录项,不应该显示“条1” ( fixed in commit 8da4f57 )

  • 不仅显示起始条,还显示到达条。 ( fixed in commit a60c773c )

按钮在 iOS 设备上容不下两个字

如“分享”、“取消”、“完成”。

发现:<button> 有默认 padding,使得其内容面积相对变小。

办法:为出现问题的几个按钮强制 padding: 0

end-to-end test

...on nodejs platform.

Compare text content from both the .txt file and the .html file.

Simple implementation: compare text while ignoring space characters, such as ' ', '\r', '\n', '\u3000'.

识别种子法第九十二条第六项里包含的多段

这里

这里的多段目前被识别为款,是不对的。要正确识别这种结构,一方面,一个“款”应该要有容纳多段的能力;另一方面,可能需要 second pass 通过上下文(比如此处多段在第(六)项与第(七)项之间)来确认这样没有段首标志的段是新款,还是原款的多段拓展。

识别“至”

实例:

本章第一节至第五节
本法第二章第一节至第五节
本法第四十八条第一款第一项、第三项至第五项
本法第五十三条第(一)项至第(三)项
前款第(一)项至第(三)项
前款第二项、第四项情形之一的,……;有第一项、第三项、第五项至第八项
本节第一百四十一条至第一百四十八条
本节第一百四十条至第一百四十八条
本节第二百零一条至第二百零五条
本节第二百一十三条至第二百一十九条
本节第二百二十一条至第二百三十条
本节第三百三十八条至第三百四十五条
本法第三十三条第一款第一项至第四项
本法第六十七条第一款第一项至第六项、第八项、第九项
前款第(五)项至第(十七)项
本条第一款第(五)项至第(十七)项
本法第十条第一款第(五)项至第(十七)项
本法第十条第一款第(五)项至第(十七)项
前款第(三)项至第(六)项
本法第三十八条第一款第(三)项至第(六)项
《中华人民共和国民事诉讼法》第九十三条至第九十六条和第九十九条
本法第七十九条、第八十一条至第八十三条、第八十五条至第八十七条
本法第二十八条至第三十条
本法第一百八十条第一款第一项至第三项
本法第二十二条第三款、第四十一条至第四十三条

为英文字符串、数字和双引号内容添加前后半个字的空白

以提高可读性以及整体排版整洁度。

对双引号的作用特别值得关注。“全角”双引号的实现有赖于合适的中文字体。然而,在移动端,中文字体的选择极其有限,“半角”双引号无法与周围文字适当隔离的问题很突出。因此,以期在排版层面(而不是在字符层面)的前后留白能更通用地解决问题。

鼠标点击链接跳跃后,点击返回会跳到页顶

……并且会把页面的 hash 改为 "#"。(在 Chrome 上)

这个问题没发生在 touch 触发的行为上。

经逐步调试,发现该现象是因为点击返回后,页面出现了两次跳转,先跳向正确的位置,然后 backButton.pop() 操作后修改了返回键的 href 至 “#”,页面奇怪地又做了第二次跳转。

打印后的页面还原/清理不完全,保留了多个 entry-num 元素

在启动打印模式时,页面里每一条附带的一个 entry-num 元素被复制为两个元素,并显示在相应条的左右两侧。而当关闭打印模式,被复制出来的 entry-num 元素应该及时被删除。但现在却没有删除。导致当多次启动、关闭打印模式后,页面里的每个条下面都多出来好几个 entry-num 元素的克隆。

添加宪法

特别注意要对其中的“序言”部分做识别。

CSS print media: need page break before the first item of main body when there is no TOC

Currently, in print, TOC serves as the the page breaker after the title and before the first item of main body.

But there are documents that don't have a TOC, or rather, don't need one. When we print these documents, the first item of the main body would immediately follow the title (or the paragraphs following the title), which could be fine but they would also cover the qrcode that is supposed to appear on the first page with the title.

So, we need to add a page break for documents that have no TOC.

识别“目”

……包括为“目”提供带条款项上下文的ID。

  • 识别文中的目
  • 识别文中对目的引用

识别名为“第XXX条之一”的条款

如刑法里第一百七十五条后面的“第一百七十五条之一”,第一百七十七条后面的“第一百七十七条之一”,等等。

它们出现的原因,可能是修正案中要新添与“条”等级别的段落,却又怕对后面的条款标号造成太大影响。

让“节”ID包含“章”上下文信息

……目前来看,“章”属于单个文档顶层结构,而“节”包含于其中。

如:“节1”无法定位到某一节,因为该ID没有描述该节位于第几章内。

避免把多行句识别为多款

例如:

另一方面,有需要避免把某些多行的分款合并为一款:
例如:

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.