chuan6 / structured-law-document Goto Github PK
View Code? Open in Web Editor NEW富网页化法律文档,让法律文档易于浏览,易于分享。
Home Page: https://chuan6.github.io/structured-law-document
License: GNU General Public License v2.0
富网页化法律文档,让法律文档易于浏览,易于分享。
Home Page: https://chuan6.github.io/structured-law-document
License: GNU General Public License v2.0
体育法第八章(附则)包含了三条,第五十五、五十六、四十七条。第四十七条已无效,仅被包含与文本以供参考。
目前算法将第八章的条数区间识别为“条55-47”,可能引起误会。
方案:识别章节第一条的条数作为区间起始,而后识别该章节中最大的条数,作为区间的结束。在体育法第八章里,应该识别出“条55-56”。
如“分享”、“取消”、“完成”。
发现:<button>
有默认 padding
,使得其内容面积相对变小。
办法:为出现问题的几个按钮强制 padding: 0
。
See my article for detailed discussion.
...on nodejs platform.
Compare text content from both the .txt file and the .html file.
Simple implementation: compare text while ignoring space characters, such as ' ', '\r', '\n', '\u3000'
.
例子:刑法、物权法
...for example, differentiate each level of outline items with different shade of background color...
见这里
这里的多段目前被识别为款,是不对的。要正确识别这种结构,一方面,一个“款”应该要有容纳多段的能力;另一方面,可能需要 second pass 通过上下文(比如此处多段在第(六)项与第(七)项之间)来确认这样没有段首标志的段是新款,还是原款的多段拓展。
实例:
本章第一节至第五节
本法第二章第一节至第五节
本法第四十八条第一款第一项、第三项至第五项
本法第五十三条第(一)项至第(三)项
前款第(一)项至第(三)项
前款第二项、第四项情形之一的,……;有第一项、第三项、第五项至第八项
本节第一百四十一条至第一百四十八条
本节第一百四十条至第一百四十八条
本节第二百零一条至第二百零五条
本节第二百一十三条至第二百一十九条
本节第二百二十一条至第二百三十条
本节第三百三十八条至第三百四十五条
本法第三十三条第一款第一项至第四项
本法第六十七条第一款第一项至第六项、第八项、第九项
前款第(五)项至第(十七)项
本条第一款第(五)项至第(十七)项
本法第十条第一款第(五)项至第(十七)项
本法第十条第一款第(五)项至第(十七)项
前款第(三)项至第(六)项
本法第三十八条第一款第(三)项至第(六)项
《中华人民共和国民事诉讼法》第九十三条至第九十六条和第九十九条
本法第七十九条、第八十一条至第八十三条、第八十五条至第八十七条
本法第二十八条至第三十条
本法第一百八十条第一款第一项至第三项
本法第二十二条第三款、第四十一条至第四十三条
例子:如物权法和刑法。
以提高可读性以及整体排版整洁度。
对双引号的作用特别值得关注。“全角”双引号的实现有赖于合适的中文字体。然而,在移动端,中文字体的选择极其有限,“半角”双引号无法与周围文字适当隔离的问题很突出。因此,以期在排版层面(而不是在字符层面)的前后留白能更通用地解决问题。
……并且会把页面的 hash 改为 "#"。(在 Chrome 上)
这个问题没发生在 touch 触发的行为上。
经逐步调试,发现该现象是因为点击返回后,页面出现了两次跳转,先跳向正确的位置,然后 backButton.pop()
操作后修改了返回键的 href 至 “#”,页面奇怪地又做了第二次跳转。
……以提升用户对页面内容的可信度。
将内容转至 读法.com,并启用 https 。
……分离网页内容与负责网页生成的代码。
... such as labeling the role
attribute (main
, button
, etc) of certain HTML elements.
在启动打印模式时,页面里每一条附带的一个 entry-num 元素被复制为两个元素,并显示在相应条的左右两侧。而当关闭打印模式,被复制出来的 entry-num 元素应该及时被删除。但现在却没有删除。导致当多次启动、关闭打印模式后,页面里的每个条下面都多出来好几个 entry-num 元素的克隆。
目前,已经实现了对“法”和“规定”为起始的文内引用。但测试页面中,部分文档包含了以“办法”为起始的文内引用;包括:
识别并标出它们!
特别注意要对其中的“序言”部分做识别。
Currently, in print, TOC serves as the the page breaker after the title and before the first item of main body.
But there are documents that don't have a TOC, or rather, don't need one. When we print these documents, the first item of the main body would immediately follow the title (or the paragraphs following the title), which could be fine but they would also cover the qrcode that is supposed to appear on the first page with the title.
So, we need to add a page break for documents that have no TOC.
……包括为“目”提供带条款项上下文的ID。
如刑法里第一百七十五条后面的“第一百七十五条之一”,第一百七十七条后面的“第一百七十七条之一”,等等。
它们出现的原因,可能是修正案中要新添与“条”等级别的段落,却又怕对后面的条款标号造成太大影响。
如中华人民共和国立法法第十六条里的“……本法第二章第三节规定的……”。
……目前来看,“章”属于单个文档顶层结构,而“节”包含于其中。
如:“节1”无法定位到某一节,因为该ID没有描述该节位于第几章内。
... and probably more parts of each document that doesn't provide content for 『...』.
The validation process has been broken since the introduction of enriched-toc.
例如:
另一方面,有需要避免把某些多行的分款合并为一款:
例如:
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.