]> gitweb.michael.orlitzky.com - dead/htsn-import.git/commitdiff
Add a note to the man page about the double-SMS in a news sample.
authorMichael Orlitzky <michael@orlitzky.com>
Fri, 4 Jul 2014 20:29:36 +0000 (16:29 -0400)
committerMichael Orlitzky <michael@orlitzky.com>
Fri, 4 Jul 2014 20:29:36 +0000 (16:29 -0400)
doc/man1/htsn-import.1

index 7a215b142c420e2931045a895daa1d3ebba974c6..aebfb062bd0c4030eb047e8791bc82e17e286189 100644 (file)
@@ -268,6 +268,21 @@ construct the DTDs ourselves, the results are sometimes
 inconsistent. Here we document a few of them.
 
 .IP \[bu] 2
+\fInewsxml.dtd\fR
+
+The TSN DTD for news (and almost all XML on the wire) suggests that
+there is a exactly one (possibly-empty) <SMS> element present in each
+message. However, we have seen an example (XML_File_ID 21232353) where
+an empty <SMS> followed a non-empty one:
+
+.fi
+<SMS>Odd Man Rush: Snow under pressure to improve Isles quickly</SMS>
+<SMS></SMS>
+.nf
+
+We don't parse this case at the moment.
+
+.IP \[bu]
 \fIOdds_XML.dtd\fR
 
 The <Notes> elements here are supposed to be associated with a set of