htmlparser-cvs Mailing List for HTML Parser (Page 28)

Brought to you by: derrickoswald

htmlparser-cvs — syncmail email notification of CVS commits

You can subscribe to this list here.

2003	_Jan	_Feb	_Mar	_Apr	_May (141)	_Jun (108)	_Jul (66)	_Aug (127)	_Sep (155)	_Oct (149)	_Nov (72)	_Dec (72)
2004	_Jan (100)	_Feb (36)	_Mar (21)	_Apr (3)	_May (87)	_Jun (28)	_Jul (84)	_Aug (5)	_Sep (14)	_Oct	_Nov	_Dec
2005	_Jan (1)	_Feb (39)	_Mar (26)	_Apr (38)	_May (14)	_Jun (10)	_Jul	_Aug	_Sep (13)	_Oct (8)	_Nov (10)	_Dec
2006	_Jan	_Feb (1)	_Mar (17)	_Apr (20)	_May (28)	_Jun (24)	_Jul	_Aug	_Sep	_Oct	_Nov	_Dec
2015	_Jan	_Feb	_Mar (1)	_Apr	_May	_Jun	_Jul	_Aug	_Sep	_Oct	_Nov	_Dec

Flat | Threaded

<< < 1 .. 26 27 28 29 30 .. 61 > >> (Page 28 of 61)

[Htmlparser-cvs] htmlparser/src/org/htmlparser/parserapplications LinkExtractor.java,1.48,1.49 MailRipper.java,1.49,1.50 Robot.java,1.51,1.52 StringExtractor.java,1.44,1.45 package.html,1.17,1.18

From: <der...@us...> - 2003-12-08 01:32:25

Update of /cvsroot/htmlparser/htmlparser/src/org/htmlparser/parserapplications
In directory sc8-pr-cvs1:/tmp/cvs-serv1466/src/org/htmlparser/parserapplications

Modified Files:
	LinkExtractor.java MailRipper.java Robot.java 
	StringExtractor.java package.html 
Log Message:
Update version headers to 1.4-20031207 and update changelog.



Index: LinkExtractor.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/parserapplications/LinkExtractor.java,v
retrieving revision 1.48
retrieving revision 1.49
diff -C2 -d -r1.48 -r1.49
*** LinkExtractor.java	7 Dec 2003 23:41:40 -0000	1.48
--- LinkExtractor.java	8 Dec 2003 01:31:52 -0000	1.49
***************
*** 1,3 ****
! // HTMLParser Library v1_4_20031109 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //
--- 1,3 ----
! // HTMLParser Library v1_4_20031207 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //

Index: MailRipper.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/parserapplications/MailRipper.java,v
retrieving revision 1.49
retrieving revision 1.50
diff -C2 -d -r1.49 -r1.50
*** MailRipper.java	7 Dec 2003 23:41:40 -0000	1.49
--- MailRipper.java	8 Dec 2003 01:31:52 -0000	1.50
***************
*** 1,3 ****
! // HTMLParser Library v1_4_20031109 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //
--- 1,3 ----
! // HTMLParser Library v1_4_20031207 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //

Index: Robot.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/parserapplications/Robot.java,v
retrieving revision 1.51
retrieving revision 1.52
diff -C2 -d -r1.51 -r1.52
*** Robot.java	7 Dec 2003 23:41:40 -0000	1.51
--- Robot.java	8 Dec 2003 01:31:52 -0000	1.52
***************
*** 1,3 ****
! // HTMLParser Library v1_4_20031109 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //
--- 1,3 ----
! // HTMLParser Library v1_4_20031207 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //

Index: StringExtractor.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/parserapplications/StringExtractor.java,v
retrieving revision 1.44
retrieving revision 1.45
diff -C2 -d -r1.44 -r1.45
*** StringExtractor.java	9 Nov 2003 17:07:09 -0000	1.44
--- StringExtractor.java	8 Dec 2003 01:31:52 -0000	1.45
***************
*** 1,3 ****
! // HTMLParser Library v1_4_20031109 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //
--- 1,3 ----
! // HTMLParser Library v1_4_20031207 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //

Index: package.html
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/parserapplications/package.html,v
retrieving revision 1.17
retrieving revision 1.18
diff -C2 -d -r1.17 -r1.18
*** package.html	9 Nov 2003 17:07:09 -0000	1.17
--- package.html	8 Dec 2003 01:31:52 -0000	1.18
***************
*** 5,9 ****
    @(#)package.html  1.60 98/01/27
  
!  HTMLParser Library v1_4_20031109 - A java-based parser for HTML
   Copyright (C) Dec 31, 2000 Somik Raha
  
--- 5,9 ----
    @(#)package.html  1.60 98/01/27
  
!  HTMLParser Library v1_4_20031207 - A java-based parser for HTML
   Copyright (C) Dec 31, 2000 Somik Raha

[Htmlparser-cvs] htmlparser/src/org/htmlparser/lexer/nodes Attribute.java,1.15,1.16 PageAttribute.java,1.4,1.5 RemarkNode.java,1.14,1.15 StringNode.java,1.15,1.16 TagNode.java,1.25,1.26 package.html,1.8,1.9

From: <der...@us...> - 2003-12-08 01:32:25

Update of /cvsroot/htmlparser/htmlparser/src/org/htmlparser/lexer/nodes
In directory sc8-pr-cvs1:/tmp/cvs-serv1466/src/org/htmlparser/lexer/nodes

Modified Files:
	Attribute.java PageAttribute.java RemarkNode.java 
	StringNode.java TagNode.java package.html 
Log Message:
Update version headers to 1.4-20031207 and update changelog.



Index: Attribute.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/lexer/nodes/Attribute.java,v
retrieving revision 1.15
retrieving revision 1.16
diff -C2 -d -r1.15 -r1.16
*** Attribute.java	7 Dec 2003 23:41:40 -0000	1.15
--- Attribute.java	8 Dec 2003 01:31:51 -0000	1.16
***************
*** 1,3 ****
! // HTMLParser Library v1_4_20031109 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //
--- 1,3 ----
! // HTMLParser Library v1_4_20031207 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //

Index: PageAttribute.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/lexer/nodes/PageAttribute.java,v
retrieving revision 1.4
retrieving revision 1.5
diff -C2 -d -r1.4 -r1.5
*** PageAttribute.java	9 Nov 2003 17:07:09 -0000	1.4
--- PageAttribute.java	8 Dec 2003 01:31:51 -0000	1.5
***************
*** 1,3 ****
! // HTMLParser Library v1_4_20031109 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //
--- 1,3 ----
! // HTMLParser Library v1_4_20031207 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //

Index: RemarkNode.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/lexer/nodes/RemarkNode.java,v
retrieving revision 1.14
retrieving revision 1.15
diff -C2 -d -r1.14 -r1.15
*** RemarkNode.java	7 Dec 2003 23:41:40 -0000	1.14
--- RemarkNode.java	8 Dec 2003 01:31:51 -0000	1.15
***************
*** 1,3 ****
! // HTMLParser Library v1_4_20031109 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //
--- 1,3 ----
! // HTMLParser Library v1_4_20031207 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //

Index: StringNode.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/lexer/nodes/StringNode.java,v
retrieving revision 1.15
retrieving revision 1.16
diff -C2 -d -r1.15 -r1.16
*** StringNode.java	7 Dec 2003 23:41:40 -0000	1.15
--- StringNode.java	8 Dec 2003 01:31:51 -0000	1.16
***************
*** 1,3 ****
! // HTMLParser Library v1_4_20031109 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //
--- 1,3 ----
! // HTMLParser Library v1_4_20031207 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //

Index: TagNode.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/lexer/nodes/TagNode.java,v
retrieving revision 1.25
retrieving revision 1.26
diff -C2 -d -r1.25 -r1.26
*** TagNode.java	7 Dec 2003 23:41:40 -0000	1.25
--- TagNode.java	8 Dec 2003 01:31:52 -0000	1.26
***************
*** 1,3 ****
! // HTMLParser Library v1_4_20031109 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //
--- 1,3 ----
! // HTMLParser Library v1_4_20031207 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //

Index: package.html
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/lexer/nodes/package.html,v
retrieving revision 1.8
retrieving revision 1.9
diff -C2 -d -r1.8 -r1.9
*** package.html	9 Nov 2003 17:07:09 -0000	1.8
--- package.html	8 Dec 2003 01:31:52 -0000	1.9
***************
*** 7,11 ****
    @(#)package.html  1.60 98/01/27
  
!  HTMLParser Library v1_4_20031109 - A java-based parser for HTML
   Copyright (C) Dec 31, 2000 Somik Raha
  
--- 7,11 ----
    @(#)package.html  1.60 98/01/27
  
!  HTMLParser Library v1_4_20031207 - A java-based parser for HTML
   Copyright (C) Dec 31, 2000 Somik Raha

[Htmlparser-cvs] htmlparser/src/org/htmlparser/lexer Cursor.java,1.14,1.15 Lexer.java,1.21,1.22 Page.java,1.27,1.28 PageIndex.java,1.14,1.15 Source.java,1.13,1.14 Stream.java,1.9,1.10 package.html,1.10,1.11

From: <der...@us...> - 2003-12-08 01:32:24

Update of /cvsroot/htmlparser/htmlparser/src/org/htmlparser/lexer
In directory sc8-pr-cvs1:/tmp/cvs-serv1466/src/org/htmlparser/lexer

Modified Files:
	Cursor.java Lexer.java Page.java PageIndex.java Source.java 
	Stream.java package.html 
Log Message:
Update version headers to 1.4-20031207 and update changelog.



Index: Cursor.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/lexer/Cursor.java,v
retrieving revision 1.14
retrieving revision 1.15
diff -C2 -d -r1.14 -r1.15
*** Cursor.java	9 Nov 2003 17:07:08 -0000	1.14
--- Cursor.java	8 Dec 2003 01:31:51 -0000	1.15
***************
*** 1,3 ****
! // HTMLParser Library v1_4_20031109 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //
--- 1,3 ----
! // HTMLParser Library v1_4_20031207 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //

Index: Lexer.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/lexer/Lexer.java,v
retrieving revision 1.21
retrieving revision 1.22
diff -C2 -d -r1.21 -r1.22
*** Lexer.java	7 Dec 2003 23:41:40 -0000	1.21
--- Lexer.java	8 Dec 2003 01:31:51 -0000	1.22
***************
*** 1,3 ****
! // HTMLParser Library v1_4_20031109 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //
--- 1,3 ----
! // HTMLParser Library v1_4_20031207 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //

Index: Page.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/lexer/Page.java,v
retrieving revision 1.27
retrieving revision 1.28
diff -C2 -d -r1.27 -r1.28
*** Page.java	7 Dec 2003 23:41:40 -0000	1.27
--- Page.java	8 Dec 2003 01:31:51 -0000	1.28
***************
*** 1,3 ****
! // HTMLParser Library v1_4_20031109 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //
--- 1,3 ----
! // HTMLParser Library v1_4_20031207 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //

Index: PageIndex.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/lexer/PageIndex.java,v
retrieving revision 1.14
retrieving revision 1.15
diff -C2 -d -r1.14 -r1.15
*** PageIndex.java	9 Nov 2003 17:07:09 -0000	1.14
--- PageIndex.java	8 Dec 2003 01:31:51 -0000	1.15
***************
*** 1,3 ****
! // HTMLParser Library v1_4_20031109 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //
--- 1,3 ----
! // HTMLParser Library v1_4_20031207 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //

Index: Source.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/lexer/Source.java,v
retrieving revision 1.13
retrieving revision 1.14
diff -C2 -d -r1.13 -r1.14
*** Source.java	9 Nov 2003 17:07:09 -0000	1.13
--- Source.java	8 Dec 2003 01:31:51 -0000	1.14
***************
*** 1,3 ****
! // HTMLParser Library v1_4_20031109 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //
--- 1,3 ----
! // HTMLParser Library v1_4_20031207 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //

Index: Stream.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/lexer/Stream.java,v
retrieving revision 1.9
retrieving revision 1.10
diff -C2 -d -r1.9 -r1.10
*** Stream.java	9 Nov 2003 17:07:09 -0000	1.9
--- Stream.java	8 Dec 2003 01:31:51 -0000	1.10
***************
*** 1,3 ****
! // HTMLParser Library v1_4_20031109 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //
--- 1,3 ----
! // HTMLParser Library v1_4_20031207 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //

Index: package.html
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/lexer/package.html,v
retrieving revision 1.10
retrieving revision 1.11
diff -C2 -d -r1.10 -r1.11
*** package.html	9 Nov 2003 17:07:09 -0000	1.10
--- package.html	8 Dec 2003 01:31:51 -0000	1.11
***************
*** 7,11 ****
    @(#)package.html  1.60 98/01/27
  
!  HTMLParser Library v1_4_20031109 - A java-based parser for HTML
   Copyright (C) Dec 31, 2000 Somik Raha
  
--- 7,11 ----
    @(#)package.html  1.60 98/01/27
  
!  HTMLParser Library v1_4_20031207 - A java-based parser for HTML
   Copyright (C) Dec 31, 2000 Somik Raha

[Htmlparser-cvs] htmlparser/src/org/htmlparser/filters package.html,1.2,1.3

From: <der...@us...> - 2003-12-08 01:32:24

Update of /cvsroot/htmlparser/htmlparser/src/org/htmlparser/filters
In directory sc8-pr-cvs1:/tmp/cvs-serv1466/src/org/htmlparser/filters

Modified Files:
	package.html 
Log Message:
Update version headers to 1.4-20031207 and update changelog.



Index: package.html
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/filters/package.html,v
retrieving revision 1.2
retrieving revision 1.3
diff -C2 -d -r1.2 -r1.3
*** package.html	9 Nov 2003 17:07:08 -0000	1.2
--- package.html	8 Dec 2003 01:31:51 -0000	1.3
***************
*** 7,11 ****
    @(#)package.html  1.60 98/01/27
  
!  HTMLParser Library v1_4_20031109 - A java-based parser for HTML
   Copyright (C) Dec 31, 2000 Somik Raha
  
--- 7,11 ----
    @(#)package.html  1.60 98/01/27
  
!  HTMLParser Library v1_4_20031207 - A java-based parser for HTML
   Copyright (C) Dec 31, 2000 Somik Raha

[Htmlparser-cvs] htmlparser/src/org/htmlparser/beans BeanyBaby.java,1.19,1.20 HTMLLinkBean.java,1.19,1.20 HTMLTextBean.java,1.20,1.21 LinkBean.java,1.24,1.25 StringBean.java,1.33,1.34 package.html,1.17,1.18

From: <der...@us...> - 2003-12-08 01:32:24

Update of /cvsroot/htmlparser/htmlparser/src/org/htmlparser/beans
In directory sc8-pr-cvs1:/tmp/cvs-serv1466/src/org/htmlparser/beans

Modified Files:
	BeanyBaby.java HTMLLinkBean.java HTMLTextBean.java 
	LinkBean.java StringBean.java package.html 
Log Message:
Update version headers to 1.4-20031207 and update changelog.



Index: BeanyBaby.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/beans/BeanyBaby.java,v
retrieving revision 1.19
retrieving revision 1.20
diff -C2 -d -r1.19 -r1.20
*** BeanyBaby.java	9 Nov 2003 17:07:08 -0000	1.19
--- BeanyBaby.java	8 Dec 2003 01:31:51 -0000	1.20
***************
*** 1,3 ****
! // HTMLParser Library v1_4_20031109 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //
--- 1,3 ----
! // HTMLParser Library v1_4_20031207 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //

Index: HTMLLinkBean.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/beans/HTMLLinkBean.java,v
retrieving revision 1.19
retrieving revision 1.20
diff -C2 -d -r1.19 -r1.20
*** HTMLLinkBean.java	9 Nov 2003 17:07:08 -0000	1.19
--- HTMLLinkBean.java	8 Dec 2003 01:31:51 -0000	1.20
***************
*** 1,3 ****
! // HTMLParser Library v1_4_20031109 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //
--- 1,3 ----
! // HTMLParser Library v1_4_20031207 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //

Index: HTMLTextBean.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/beans/HTMLTextBean.java,v
retrieving revision 1.20
retrieving revision 1.21
diff -C2 -d -r1.20 -r1.21
*** HTMLTextBean.java	9 Nov 2003 17:07:08 -0000	1.20
--- HTMLTextBean.java	8 Dec 2003 01:31:51 -0000	1.21
***************
*** 1,3 ****
! /// HTMLParser Library v1_4_20031109 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //
--- 1,3 ----
! /// HTMLParser Library v1_4_20031207 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //

Index: LinkBean.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/beans/LinkBean.java,v
retrieving revision 1.24
retrieving revision 1.25
diff -C2 -d -r1.24 -r1.25
*** LinkBean.java	7 Dec 2003 23:41:39 -0000	1.24
--- LinkBean.java	8 Dec 2003 01:31:51 -0000	1.25
***************
*** 1,3 ****
! // HTMLParser Library v1_4_20031109 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //
--- 1,3 ----
! // HTMLParser Library v1_4_20031207 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //

Index: StringBean.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/beans/StringBean.java,v
retrieving revision 1.33
retrieving revision 1.34
diff -C2 -d -r1.33 -r1.34
*** StringBean.java	7 Dec 2003 23:41:39 -0000	1.33
--- StringBean.java	8 Dec 2003 01:31:51 -0000	1.34
***************
*** 1,3 ****
! // HTMLParser Library v1_4_20031109 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //
--- 1,3 ----
! // HTMLParser Library v1_4_20031207 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //

Index: package.html
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/beans/package.html,v
retrieving revision 1.17
retrieving revision 1.18
diff -C2 -d -r1.17 -r1.18
*** package.html	9 Nov 2003 17:07:08 -0000	1.17
--- package.html	8 Dec 2003 01:31:51 -0000	1.18
***************
*** 6,10 ****
    @(#)package.html  1.60 98/01/27
  
!  HTMLParser Library v1_4_20031109 - A java-based parser for HTML
   Copyright (C) Dec 31, 2000 Somik Raha
  
--- 6,10 ----
    @(#)package.html  1.60 98/01/27
  
!  HTMLParser Library v1_4_20031207 - A java-based parser for HTML
   Copyright (C) Dec 31, 2000 Somik Raha

[Htmlparser-cvs] htmlparser/src/org/htmlparser AbstractNode.java,1.21,1.22 Node.java,1.45,1.46 Parser.java,1.76,1.77 RemarkNode.java,1.38,1.39 StringNode.java,1.46,1.47 StringNodeFactory.java,1.8,1.9 package.html,1.18,1.19

From: <der...@us...> - 2003-12-08 01:32:24

Update of /cvsroot/htmlparser/htmlparser/src/org/htmlparser
In directory sc8-pr-cvs1:/tmp/cvs-serv1466/src/org/htmlparser

Modified Files:
	AbstractNode.java Node.java Parser.java RemarkNode.java 
	StringNode.java StringNodeFactory.java package.html 
Log Message:
Update version headers to 1.4-20031207 and update changelog.



Index: AbstractNode.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/AbstractNode.java,v
retrieving revision 1.21
retrieving revision 1.22
diff -C2 -d -r1.21 -r1.22
*** AbstractNode.java	9 Nov 2003 17:07:08 -0000	1.21
--- AbstractNode.java	8 Dec 2003 01:31:50 -0000	1.22
***************
*** 1,3 ****
! // HTMLParser Library v1_4_20031109 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //
--- 1,3 ----
! // HTMLParser Library v1_4_20031207 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //

Index: Node.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/Node.java,v
retrieving revision 1.45
retrieving revision 1.46
diff -C2 -d -r1.45 -r1.46
*** Node.java	9 Nov 2003 17:07:08 -0000	1.45
--- Node.java	8 Dec 2003 01:31:51 -0000	1.46
***************
*** 1,3 ****
! // HTMLParser Library v1_4_20031109 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //
--- 1,3 ----
! // HTMLParser Library v1_4_20031207 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //

Index: Parser.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/Parser.java,v
retrieving revision 1.76
retrieving revision 1.77
diff -C2 -d -r1.76 -r1.77
*** Parser.java	7 Dec 2003 23:41:39 -0000	1.76
--- Parser.java	8 Dec 2003 01:31:51 -0000	1.77
***************
*** 1,3 ****
! // HTMLParser Library v1_4_20031109 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //
--- 1,3 ----
! // HTMLParser Library v1_4_20031207 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //
***************
*** 96,100 ****
       */
      public final static String
!     VERSION_DATE = "Nov 09, 2003"
      ;
  
--- 96,100 ----
       */
      public final static String
!     VERSION_DATE = "Dec 07, 2003"
      ;
  

Index: RemarkNode.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/RemarkNode.java,v
retrieving revision 1.38
retrieving revision 1.39
diff -C2 -d -r1.38 -r1.39
*** RemarkNode.java	7 Dec 2003 23:41:39 -0000	1.38
--- RemarkNode.java	8 Dec 2003 01:31:51 -0000	1.39
***************
*** 1,3 ****
! // HTMLParser Library v1_4_20031109 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //
--- 1,3 ----
! // HTMLParser Library v1_4_20031207 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //

Index: StringNode.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/StringNode.java,v
retrieving revision 1.46
retrieving revision 1.47
diff -C2 -d -r1.46 -r1.47
*** StringNode.java	7 Dec 2003 23:41:39 -0000	1.46
--- StringNode.java	8 Dec 2003 01:31:51 -0000	1.47
***************
*** 1,3 ****
! // HTMLParser Library v1_4_20031109 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //
--- 1,3 ----
! // HTMLParser Library v1_4_20031207 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //

Index: StringNodeFactory.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/StringNodeFactory.java,v
retrieving revision 1.8
retrieving revision 1.9
diff -C2 -d -r1.8 -r1.9
*** StringNodeFactory.java	7 Dec 2003 23:41:39 -0000	1.8
--- StringNodeFactory.java	8 Dec 2003 01:31:51 -0000	1.9
***************
*** 1,3 ****
! // HTMLParser Library v1_4_20031109 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //
--- 1,3 ----
! // HTMLParser Library v1_4_20031207 - A java-based parser for HTML
  // Copyright (C) Dec 31, 2000 Somik Raha
  //

Index: package.html
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/package.html,v
retrieving revision 1.18
retrieving revision 1.19
diff -C2 -d -r1.18 -r1.19
*** package.html	9 Nov 2003 17:07:08 -0000	1.18
--- package.html	8 Dec 2003 01:31:51 -0000	1.19
***************
*** 6,10 ****
    @(#)package.html  1.60 98/01/27
  
!  HTMLParser Library v1_4_20031109 - A java-based parser for HTML
   Copyright (C) Dec 31, 2000 Somik Raha
  
--- 6,10 ----
    @(#)package.html  1.60 98/01/27
  
!  HTMLParser Library v1_4_20031207 - A java-based parser for HTML
   Copyright (C) Dec 31, 2000 Somik Raha

[Htmlparser-cvs] htmlparser/docs changes.txt,1.192,1.193 release.txt,1.51,1.52

From: <der...@us...> - 2003-12-08 01:32:23

Update of /cvsroot/htmlparser/htmlparser/docs
In directory sc8-pr-cvs1:/tmp/cvs-serv1466/docs

Modified Files:
	changes.txt release.txt 
Log Message:
Update version headers to 1.4-20031207 and update changelog.



Index: changes.txt
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/docs/changes.txt,v
retrieving revision 1.192
retrieving revision 1.193
diff -C2 -d -r1.192 -r1.193
*** changes.txt	9 Nov 2003 17:07:07 -0000	1.192
--- changes.txt	8 Dec 2003 01:31:49 -0000	1.193
***************
*** 13,16 ****
--- 13,133 ----
  *******************************************************************************
  
+ Integration Build 1.4 - 20031207
+ --------------------------------
+ 
+ 2003-12-07 18:41  derrickoswald
+ 
+ 	* src/org/htmlparser/: Parser.java, PrototypicalNodeFactory.java,
+ 	RemarkNode.java, StringNode.java, StringNodeFactory.java,
+ 	beans/LinkBean.java, beans/StringBean.java, lexer/Lexer.java,
+ 	lexer/Page.java, lexer/nodes/Attribute.java,
+ 	lexer/nodes/RemarkNode.java, lexer/nodes/StringNode.java,
+ 	lexer/nodes/TagNode.java, parserapplications/LinkExtractor.java,
+ 	parserapplications/MailRipper.java, parserapplications/Robot.java,
+ 	scanners/AppletScanner.java, scanners/BaseHrefScanner.java,
+ 	scanners/BodyScanner.java, scanners/BulletListScanner.java,
+ 	scanners/BulletScanner.java, scanners/DivScanner.java,
+ 	scanners/DoctypeScanner.java, scanners/FormScanner.java,
+ 	scanners/FrameScanner.java, scanners/FrameSetScanner.java,
+ 	scanners/HeadScanner.java, scanners/HtmlScanner.java,
+ 	scanners/ImageScanner.java, scanners/InputTagScanner.java,
+ 	scanners/LabelScanner.java, scanners/LinkScanner.java,
+ 	scanners/MetaTagScanner.java, scanners/OptionTagScanner.java,
+ 	scanners/ScriptScanner.java, scanners/SelectTagScanner.java,
+ 	scanners/SpanScanner.java, scanners/StyleScanner.java,
+ 	scanners/TableColumnScanner.java, scanners/TableRowScanner.java,
+ 	scanners/TableScanner.java, scanners/TextareaTagScanner.java,
+ 	scanners/TitleScanner.java, tags/CompositeTag.java,
+ 	tags/FormTag.java, tags/ImageTag.java, tags/InputTag.java,
+ 	tags/LabelTag.java, tags/LinkTag.java, tags/MetaTag.java,
+ 	tags/SelectTag.java, tags/TableColumn.java, tags/TableRow.java,
+ 	tags/TextareaTag.java, tests/FunctionalTests.java,
+ 	tests/InstanceofPerformanceTest.java,
+ 	tests/LineNumberAssignedByNodeReaderTest.java,
+ 	tests/ParserTest.java, tests/ParserTestCase.java,
+ 	tests/PerformanceTest.java, tests/filterTests/FilterTest.java,
+ 	tests/lexerTests/AttributeTests.java,
+ 	tests/lexerTests/TagTests.java,
+ 	tests/nodeDecoratorTests/DecodingNodeTest.java,
+ 	tests/nodeDecoratorTests/EscapeCharacterRemovingNodeTest.java,
+ 	tests/nodeDecoratorTests/NonBreakingSpaceConvertingNodeTest.java,
+ 	tests/parserHelperTests/RemarkNodeParserTest.java,
+ 	tests/parserHelperTests/StringParserTest.java,
+ 	tests/scannersTests/AllTests.java,
+ 	tests/scannersTests/AppletScannerTest.java,
+ 	tests/scannersTests/BaseHREFScannerTest.java,
+ 	tests/scannersTests/BodyScannerTest.java,
+ 	tests/scannersTests/BulletListScannerTest.java,
+ 	tests/scannersTests/BulletScannerTest.java,
+ 	tests/scannersTests/CompositeTagScannerTest.java,
+ 	tests/scannersTests/DivScannerTest.java,
+ 	tests/scannersTests/FormScannerTest.java,
+ 	tests/scannersTests/FrameScannerTest.java,
+ 	tests/scannersTests/FrameSetScannerTest.java,
+ 	tests/scannersTests/HeadScannerTest.java,
+ 	tests/scannersTests/HtmlTest.java,
+ 	tests/scannersTests/ImageScannerTest.java,
+ 	tests/scannersTests/InputTagScannerTest.java,
+ 	tests/scannersTests/JspScannerTest.java,
+ 	tests/scannersTests/LabelScannerTest.java,
+ 	tests/scannersTests/LinkScannerTest.java,
+ 	tests/scannersTests/MetaTagScannerTest.java,
+ 	tests/scannersTests/OptionTagScannerTest.java,
+ 	tests/scannersTests/ScriptScannerTest.java,
+ 	tests/scannersTests/SelectTagScannerTest.java,
+ 	tests/scannersTests/SpanScannerTest.java,
+ 	tests/scannersTests/StyleScannerTest.java,
+ 	tests/scannersTests/TableScannerTest.java,
+ 	tests/scannersTests/TextareaTagScannerTest.java,
+ 	tests/scannersTests/TitleScannerTest.java,
+ 	tests/scannersTests/XmlEndTagScanningTest.java,
+ 	tests/tagTests/AllTests.java, tests/tagTests/AppletTagTest.java,
+ 	tests/tagTests/BaseHrefTagTest.java,
+ 	tests/tagTests/BodyTagTest.java,
+ 	tests/tagTests/BulletListTagTest.java,
+ 	tests/tagTests/BulletTagTest.java,
+ 	tests/tagTests/CompositeTagTest.java,
+ 	tests/tagTests/DivTagTest.java, tests/tagTests/DoctypeTagTest.java,
+ 	tests/tagTests/EndTagTest.java, tests/tagTests/FormTagTest.java,
+ 	tests/tagTests/FrameSetTagTest.java,
+ 	tests/tagTests/FrameTagTest.java, tests/tagTests/HeadTagTest.java,
+ 	tests/tagTests/HtmlTagTest.java, tests/tagTests/ImageTagTest.java,
+ 	tests/tagTests/InputTagTest.java, tests/tagTests/JspTagTest.java,
+ 	tests/tagTests/LabelTagTest.java, tests/tagTests/LinkTagTest.java,
+ 	tests/tagTests/MetaTagTest.java,
+ 	tests/tagTests/ObjectCollectionTest.java,
+ 	tests/tagTests/OptionTagTest.java,
+ 	tests/tagTests/ScriptTagTest.java,
+ 	tests/tagTests/SelectTagTest.java, tests/tagTests/SpanTagTest.java,
+ 	tests/tagTests/StyleTagTest.java, tests/tagTests/TableTagTest.java,
+ 	tests/tagTests/TagTest.java, tests/tagTests/TextareaTagTest.java,
+ 	tests/tagTests/TitleTagTest.java, tests/utilTests/BeanTest.java,
+ 	tests/utilTests/HTMLLinkProcessorTest.java,
+ 	tests/visitorsTests/HtmlPageTest.java,
+ 	tests/visitorsTests/LinkFindingVisitorTest.java,
+ 	tests/visitorsTests/TextExtractingVisitorTest.java,
+ 	util/Generate.java, util/ParserUtils.java, util/Translate.java,
+ 	visitors/HtmlPage.java, visitors/NodeVisitor.java,
+ 	visitors/UrlModifyingVisitor.java:
+ 
+ 	Remove most of the scanners.
+ 	The only scanners left are ones that really do something different (script and jsp).
+ 	Instead of registering a scanner to enable returning a specific tag you now add a
+ 	tag to the a PrototypicalNodeFactory. All known tags are 'registered' by default
+ 	in a new Parser which is similar to having called the old 'registerDOMScanners()',
+ 	so tags are fully nested. This is different behaviour, and specifically,
+ 	you will need to recurse into returned nodes to get at what you want.
+ 	I've tried to adjust the applications accordingly, but worked examples are still scarce.
+ 	If you want to return only some of the derived tags while keeping most as generic tags,
+ 	there are various constructors and manipulators on the factory. See the javadocs
+ 	and examples in the tests package.
+ 	Nearly all the old scanner tests are folded into the tag tests.
+ 	
+ 	toString() has been revamped.
+ 	This means that the default Parser mainline now returns an indented listing of tags,
+ 	making it easy to see the structure of a page. The downside is the text of the page
+ 	had to have newlines, tabs etc. turned into escape sequences. But if you were really
+ 	interested in content you would be using toHtml() or toPlainTextString().
+ 	
  Integration Build 1.4 - 20031109
  --------------------------------

Index: release.txt
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/docs/release.txt,v
retrieving revision 1.51
retrieving revision 1.52
diff -C2 -d -r1.51 -r1.52
*** release.txt	9 Nov 2003 17:07:07 -0000	1.51
--- release.txt	8 Dec 2003 01:31:50 -0000	1.52
***************
*** 1,3 ****
! HTMLParser Version 1.4 (Integration Build Nov 09, 2003)
  *********************************************
  
--- 1,3 ----
! HTMLParser Version 1.4 (Integration Build Dec 07, 2003)
  *********************************************

[Htmlparser-cvs] htmlparser/src/org/htmlparser/tests FunctionalTests.java,1.50,1.51 InstanceofPerformanceTest.java,1.17,1.18 LineNumberAssignedByNodeReaderTest.java,1.28,1.29 ParserTest.java,1.49,1.50 ParserTestCase.java,1.40,1.41 PerformanceTest.java,1.44,1.45

From: <der...@us...> - 2003-12-07 23:42:15

Update of /cvsroot/htmlparser/htmlparser/src/org/htmlparser/tests
In directory sc8-pr-cvs1:/tmp/cvs-serv16537/tests

Modified Files:
	FunctionalTests.java InstanceofPerformanceTest.java 
	LineNumberAssignedByNodeReaderTest.java ParserTest.java 
	ParserTestCase.java PerformanceTest.java 
Log Message:
Remove most of the scanners.
The only scanners left are ones that really do something different (script and jsp).
Instead of registering a scanner to enable returning a specific tag you now add a 
tag to the a PrototypicalNodeFactory. All known tags are 'registered' by default
in a new Parser which is similar to having called the old 'registerDOMScanners()',
so tags are fully nested. This is different behaviour, and specifically,
you will need to recurse into returned nodes to get at what you want.
I've tried to adjust the applications accordingly, but worked examples are still scarce.
If you want to return only some of the derived tags while keeping most as generic tags,
there are various constructors and manipulators on the factory. See the javadocs
and examples in the tests package.
Nearly all the old scanner tests are folded into the tag tests.

toString() has been revamped.
This means that the default Parser mainline now returns an indented listing of tags,
making it easy to see the structure of a page. The downside is the text of the page
had to have newlines, tabs etc. turned into escape sequences. But if you were really
interested in content you would be using toHtml() or toPlainTextString().



Index: FunctionalTests.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/tests/FunctionalTests.java,v
retrieving revision 1.50
retrieving revision 1.51
diff -C2 -d -r1.50 -r1.51
*** FunctionalTests.java	9 Nov 2003 17:07:13 -0000	1.50
--- FunctionalTests.java	7 Dec 2003 23:41:41 -0000	1.51
***************
*** 42,46 ****
  import org.htmlparser.Node;
  import org.htmlparser.Parser;
! import org.htmlparser.scanners.ImageScanner;
  import org.htmlparser.tags.ImageTag;
  import org.htmlparser.util.DefaultParserFeedback;
--- 42,46 ----
  import org.htmlparser.Node;
  import org.htmlparser.Parser;
! import org.htmlparser.PrototypicalNodeFactory;
  import org.htmlparser.tags.ImageTag;
  import org.htmlparser.util.DefaultParserFeedback;
***************
*** 89,93 ****
      public int countImageTagsWithHTMLParser() throws ParserException {
          Parser parser = new Parser("http://education.yahoo.com/",new DefaultParserFeedback());
!         parser.addScanner(new ImageScanner("-i"));
          setParser (parser);
          int parserImgTagCount = 0;
--- 89,93 ----
      public int countImageTagsWithHTMLParser() throws ParserException {
          Parser parser = new Parser("http://education.yahoo.com/",new DefaultParserFeedback());
!         parser.setNodeFactory (new PrototypicalNodeFactory (new ImageTag ()));
          setParser (parser);
          int parserImgTagCount = 0;

Index: InstanceofPerformanceTest.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/tests/InstanceofPerformanceTest.java,v
retrieving revision 1.17
retrieving revision 1.18
diff -C2 -d -r1.17 -r1.18
*** InstanceofPerformanceTest.java	9 Nov 2003 17:07:13 -0000	1.17
--- InstanceofPerformanceTest.java	7 Dec 2003 23:41:41 -0000	1.18
***************
*** 35,43 ****
  import org.htmlparser.Parser;
  import org.htmlparser.tags.FormTag;
- import org.htmlparser.tests.scannersTests.FormScannerTest;
  import org.htmlparser.util.NodeIterator;
  import org.htmlparser.util.SimpleNodeIterator;
  
  public class InstanceofPerformanceTest {
      FormTag formTag;
      Vector formChildren;
--- 35,59 ----
  import org.htmlparser.Parser;
  import org.htmlparser.tags.FormTag;
  import org.htmlparser.util.NodeIterator;
  import org.htmlparser.util.SimpleNodeIterator;
  
  public class InstanceofPerformanceTest {
+ 
+     public static final String FORM_HTML =
+     "<FORM METHOD=\""+FormTag.POST+"\" ACTION=\"do_login.php\" NAME=\"login_form\" onSubmit=\"return CheckData()\">\n"+
+         "<TR><TD ALIGN=\"center\">&nbsp;</TD></TR>\n"+
+         "<TR><TD ALIGN=\"center\"><FONT face=\"Arial, verdana\" size=2><b>User Name</b></font></TD></TR>\n"+
+         "<TR><TD ALIGN=\"center\"><INPUT TYPE=\"text\" NAME=\"name\" SIZE=\"20\"></TD></TR>\n"+
+         "<TR><TD ALIGN=\"center\"><FONT face=\"Arial, verdana\" size=2><b>Password</b></font></TD></TR>\n"+
+         "<TR><TD ALIGN=\"center\"><INPUT TYPE=\"password\" NAME=\"passwd\" SIZE=\"20\"></TD></TR>\n"+
+         "<TR><TD ALIGN=\"center\">&nbsp;</TD></TR>\n"+
+         "<TR><TD ALIGN=\"center\"><INPUT TYPE=\"submit\" NAME=\"submit\" VALUE=\"Login\"></TD></TR>\n"+
+         "<TR><TD ALIGN=\"center\">&nbsp;</TD></TR>\n"+
+         "<TEXTAREA name=\"Description\" rows=\"15\" cols=\"55\" wrap=\"virtual\" class=\"composef\" tabindex=\"5\">Contents of TextArea</TEXTAREA>\n"+
+ //      "<TEXTAREA name=\"AnotherDescription\" rows=\"15\" cols=\"55\" wrap=\"virtual\" class=\"composef\" tabindex=\"5\">\n"+
+         "<INPUT TYPE=\"hidden\" NAME=\"password\" SIZE=\"20\">\n"+
+         "<INPUT TYPE=\"submit\">\n"+
+         "</FORM>";
+ 
      FormTag formTag;
      Vector formChildren;
***************
*** 45,51 ****
          Parser parser =
              Parser.createParser(
!                 FormScannerTest.FORM_HTML
              );
-         parser.registerScanners();
          NodeIterator e = parser.elements();
          Node node = e.nextNode();
--- 61,66 ----
          Parser parser =
              Parser.createParser(
!                 FORM_HTML
              );
          NodeIterator e = parser.elements();
          Node node = e.nextNode();

Index: LineNumberAssignedByNodeReaderTest.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/tests/LineNumberAssignedByNodeReaderTest.java,v
retrieving revision 1.28
retrieving revision 1.29
diff -C2 -d -r1.28 -r1.29
*** LineNumberAssignedByNodeReaderTest.java	9 Nov 2003 17:07:13 -0000	1.28
--- LineNumberAssignedByNodeReaderTest.java	7 Dec 2003 23:41:41 -0000	1.29
***************
*** 35,41 ****
  import junit.framework.TestSuite;
  
! import org.htmlparser.tests.scannersTests.CompositeTagScannerTest.CustomScanner;
  import org.htmlparser.tests.scannersTests.CompositeTagScannerTest.CustomTag;
  import org.htmlparser.util.ParserException;
  /**
   * @author Somik Raha
--- 35,42 ----
  import junit.framework.TestSuite;
  
! import org.htmlparser.PrototypicalNodeFactory;
  import org.htmlparser.tests.scannersTests.CompositeTagScannerTest.CustomTag;
  import org.htmlparser.util.ParserException;
+ 
  /**
   * @author Somik Raha
***************
*** 145,149 ****
      private void testLineNumber(String xml, int numNodes, int useNode, int expectedStartLine, int expectedEndLine) throws ParserException {
          createParser(xml);
!         parser.addScanner(new CustomScanner());
          parseAndAssertNodeCount(numNodes);
          assertType("custom node",CustomTag.class,node[useNode]);
--- 146,150 ----
      private void testLineNumber(String xml, int numNodes, int useNode, int expectedStartLine, int expectedEndLine) throws ParserException {
          createParser(xml);
!         parser.setNodeFactory (new PrototypicalNodeFactory (new CustomTag ()));
          parseAndAssertNodeCount(numNodes);
          assertType("custom node",CustomTag.class,node[useNode]);

Index: ParserTest.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/tests/ParserTest.java,v
retrieving revision 1.49
retrieving revision 1.50
diff -C2 -d -r1.49 -r1.50
*** ParserTest.java	9 Nov 2003 17:07:14 -0000	1.49
--- ParserTest.java	7 Dec 2003 23:41:41 -0000	1.50
***************
*** 40,43 ****
--- 40,44 ----
  import org.htmlparser.Node;
  import org.htmlparser.Parser;
+ import org.htmlparser.PrototypicalNodeFactory;
  import org.htmlparser.StringNode;
  import org.htmlparser.filters.NodeClassFilter;
***************
*** 45,53 ****
  import org.htmlparser.lexer.Lexer;
  import org.htmlparser.lexer.Page;
- import org.htmlparser.scanners.FormScanner;
  import org.htmlparser.scanners.TagScanner;
  import org.htmlparser.tags.BodyTag;
  import org.htmlparser.tags.ImageTag;
  import org.htmlparser.tags.LinkTag;
  import org.htmlparser.tags.Tag;
  import org.htmlparser.util.DefaultParserFeedback;
--- 46,54 ----
  import org.htmlparser.lexer.Lexer;
  import org.htmlparser.lexer.Page;
  import org.htmlparser.scanners.TagScanner;
  import org.htmlparser.tags.BodyTag;
  import org.htmlparser.tags.ImageTag;
  import org.htmlparser.tags.LinkTag;
+ import org.htmlparser.tags.MetaTag;
  import org.htmlparser.tags.Tag;
  import org.htmlparser.util.DefaultParserFeedback;
***************
*** 300,303 ****
--- 301,305 ----
              out.close ();
              parser = new Parser (connection);
+             parser.setNodeFactory (new PrototypicalNodeFactory (true));
          }
          catch (Exception e)
***************
*** 352,355 ****
--- 354,358 ----
              out.close ();
              parser = new Parser (file.getAbsolutePath (), new DefaultParserFeedback(DefaultParserFeedback.QUIET));
+             parser.setNodeFactory (new PrototypicalNodeFactory (true));
              nodes = new AbstractNode[30];
              i = 0;
***************
*** 404,408 ****
          {
              parser = new Parser("http://www.sony.co.jp", Parser.noFeedback);
-             parser.registerScanners ();
              assertEquals("Character set by default is ISO-8859-1", "ISO-8859-1", parser.getEncoding ());
              enumeration = parser.elements();
--- 407,410 ----
***************
*** 432,435 ****
--- 434,438 ----
  
          parser = new Parser(url);
+         parser.setNodeFactory (new PrototypicalNodeFactory (new MetaTag ()));
          i = 0;
          nodes = new AbstractNode[30];
***************
*** 454,458 ****
  
          parser = new Parser(url);
-         parser.registerScanners ();
          for (NodeIterator e = parser.elements();e.hasMoreNodes();)
              e.nextNode();
--- 457,460 ----
***************
*** 475,479 ****
  
          parser = new Parser(url);
-         parser.registerScanners ();
          for (NodeIterator e = parser.elements();e.hasMoreNodes();)
              e.nextNode();
--- 477,480 ----
***************
*** 544,548 ****
              page.setConnection (connection);
              parser = new Parser (new Lexer (page));
-             parser.registerScanners ();
              // must be the default
              assertTrue ("Wrong encoding", parser.getEncoding ().equals ("ISO-8859-1"));
--- 545,548 ----
***************
*** 575,578 ****
--- 575,579 ----
  
          parser = new Parser(url);
+         parser.setNodeFactory (new PrototypicalNodeFactory (true));
          Node node [] = new AbstractNode[30];
          int i = 0;
***************
*** 636,640 ****
          "<p><font size=-2>&copy;2002 Google</font><font size=-2> - Searching 3,083,324,652 web pages</font></center></body></html>\n"
          );
-         parser.registerScanners();
          NodeList collectionList = new NodeList();
          NodeClassFilter filter = new NodeClassFilter (LinkTag.class);
--- 637,640 ----
***************
*** 690,694 ****
          "</body>\n"+
          "</html>");
-         parser.registerScanners();
          NodeList collectionList = new NodeList();
          TagNameFilter filter = new TagNameFilter ("IMG");
--- 690,693 ----
***************
*** 703,717 ****
      }
  
-     public void testRemoveScanner() throws Exception {
-         createParser(
-             ""
-         );
-         parser.registerScanners();
-         parser.removeScanner(new FormScanner("",parser));
-         Map scanners = parser.getScanners();
-         TagScanner scanner = (TagScanner)scanners.get("FORM");
-         assertNull("shouldnt have found scanner",scanner);
-     }
- 
      /**
       * See bug #728241 OutOfMemory error/ Infinite loop
--- 702,705 ----
***************
*** 748,751 ****
--- 736,740 ----
              + "</table>\n"
              + "</body></html>");
+         parser.setNodeFactory (new PrototypicalNodeFactory (true));
          int i = 0;
          for (NodeIterator e = parser.elements();e.hasMoreNodes();)

Index: ParserTestCase.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/tests/ParserTestCase.java,v
retrieving revision 1.40
retrieving revision 1.41
diff -C2 -d -r1.40 -r1.41
*** ParserTestCase.java	9 Nov 2003 17:07:14 -0000	1.40
--- ParserTestCase.java	7 Dec 2003 23:41:41 -0000	1.41
***************
*** 67,71 ****
      protected void parse(String response) throws ParserException {
          createParser(response,10000);
-         parser.registerScanners();
          parseNodes();
      }
--- 67,70 ----

Index: PerformanceTest.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/tests/PerformanceTest.java,v
retrieving revision 1.44
retrieving revision 1.45
diff -C2 -d -r1.44 -r1.45
*** PerformanceTest.java	9 Nov 2003 17:07:14 -0000	1.44
--- PerformanceTest.java	7 Dec 2003 23:41:41 -0000	1.45
***************
*** 89,93 ****
              // Create the parser object
              parser = new Parser(file,new DefaultParserFeedback());
-             parser.registerScanners();
              Node node;
              long start=System.currentTimeMillis();
--- 89,92 ----

[Htmlparser-cvs] htmlparser/src/org/htmlparser/tests/lexerTests AttributeTests.java,1.6,1.7 TagTests.java,1.6,1.7

From: <der...@us...> - 2003-12-07 23:42:15

Update of /cvsroot/htmlparser/htmlparser/src/org/htmlparser/tests/lexerTests
In directory sc8-pr-cvs1:/tmp/cvs-serv16537/tests/lexerTests

Modified Files:
	AttributeTests.java TagTests.java 
Log Message:
Remove most of the scanners.
The only scanners left are ones that really do something different (script and jsp).
Instead of registering a scanner to enable returning a specific tag you now add a 
tag to the a PrototypicalNodeFactory. All known tags are 'registered' by default
in a new Parser which is similar to having called the old 'registerDOMScanners()',
so tags are fully nested. This is different behaviour, and specifically,
you will need to recurse into returned nodes to get at what you want.
I've tried to adjust the applications accordingly, but worked examples are still scarce.
If you want to return only some of the derived tags while keeping most as generic tags,
there are various constructors and manipulators on the factory. See the javadocs
and examples in the tests package.
Nearly all the old scanner tests are folded into the tag tests.

toString() has been revamped.
This means that the default Parser mainline now returns an indented listing of tags,
making it easy to see the structure of a page. The downside is the text of the page
had to have newlines, tabs etc. turned into escape sequences. But if you were really
interested in content you would be using toHtml() or toPlainTextString().



Index: AttributeTests.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/tests/lexerTests/AttributeTests.java,v
retrieving revision 1.6
retrieving revision 1.7
diff -C2 -d -r1.6 -r1.7
*** AttributeTests.java	9 Nov 2003 17:07:14 -0000	1.6
--- AttributeTests.java	7 Dec 2003 23:41:41 -0000	1.7
***************
*** 35,38 ****
--- 35,39 ----
  
  import org.htmlparser.Parser;
+ import org.htmlparser.PrototypicalNodeFactory;
  import org.htmlparser.lexer.nodes.Attribute;
  import org.htmlparser.lexer.nodes.PageAttribute;
***************
*** 68,71 ****
--- 69,73 ----
          html = "<" + tagContents + ">";
          createParser (html);
+         parser.setNodeFactory (new PrototypicalNodeFactory (true));
          try
          {

Index: TagTests.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/tests/lexerTests/TagTests.java,v
retrieving revision 1.6
retrieving revision 1.7
diff -C2 -d -r1.6 -r1.7
*** TagTests.java	9 Nov 2003 17:07:14 -0000	1.6
--- TagTests.java	7 Dec 2003 23:41:41 -0000	1.7
***************
*** 33,36 ****
--- 33,37 ----
  import org.htmlparser.Node;
  import org.htmlparser.Parser;
+ import org.htmlparser.PrototypicalNodeFactory;
  import org.htmlparser.tags.LinkTag;
  import org.htmlparser.tags.MetaTag;
***************
*** 92,95 ****
--- 93,97 ----
  
          createParser(testHtml);
+         parser.setNodeFactory (new PrototypicalNodeFactory (true));
          parseAndAssertNodeCount(1);
          assertType("should be Tag",Tag.class,node[0]);
***************
*** 107,110 ****
--- 109,113 ----
          String html = "<custom/>";
          createParser(html);
+         parser.setNodeFactory (new PrototypicalNodeFactory (true));
          parseAndAssertNodeCount(1);
          assertType("should be Tag",Tag.class,node[0]);
***************
*** 121,124 ****
--- 124,128 ----
      public void testTagWithCloseTagSymbolInAttribute() throws ParserException {
          createParser("<tag att=\"a>b\">");
+         parser.setNodeFactory (new PrototypicalNodeFactory (true));
          parseAndAssertNodeCount(1);
          assertType("should be Tag",Tag.class,node[0]);
***************
*** 129,132 ****
--- 133,137 ----
      public void testTagWithOpenTagSymbolInAttribute() throws ParserException {
          createParser("<tag att=\"a<b\">");
+         parser.setNodeFactory (new PrototypicalNodeFactory (true));
          parseAndAssertNodeCount(1);
          assertType("should be Tag",Tag.class,node[0]);
***************
*** 138,141 ****
--- 143,147 ----
          String html = "<tag att=\'a<b\'>";
          createParser(html);
+         parser.setNodeFactory (new PrototypicalNodeFactory (true));
          parseAndAssertNodeCount(1);
          assertType("should be Tag",Tag.class,node[0]);
***************
*** 154,158 ****
          String html = "<meta name=\"foo\" content=\"foo<bar>\">";
          createParser(html);
-         parser.registerScanners ();
          parseAndAssertNodeCount (1);
          assertType ("should be MetaTag", MetaTag.class, node[0]);
--- 160,163 ----
***************
*** 169,173 ****
          String html = "<meta name=\"foo\" content=\"foo<bar\">";
          createParser(html);
-         parser.registerScanners ();
          parseAndAssertNodeCount (1);
          assertType ("should be MetaTag", MetaTag.class, node[0]);
--- 174,177 ----
***************
*** 184,188 ****
          String html = "<meta name=\"foo\" content=\"foobar>\">";
          createParser(html);
-         parser.registerScanners ();
          parseAndAssertNodeCount (1);
          assertType ("should be MetaTag", MetaTag.class, node[0]);
--- 188,191 ----
***************
*** 199,203 ****
          String html = "<meta name=\"foo\" content=\"foo\nbar>\">";
          createParser(html);
-         parser.registerScanners ();
          parseAndAssertNodeCount (1);
          assertType ("should be MetaTag", MetaTag.class, node[0]);
--- 202,205 ----
***************
*** 220,224 ****
          String html = "<meta name=\"foo\" content=\"<foo>\nbar\">";
          createParser(html);
-         parser.registerScanners ();
          parseAndAssertNodeCount (1);
          assertType ("should be MetaTag", MetaTag.class, node[0]);
--- 222,225 ----
***************
*** 241,245 ****
          String html = "<meta name=\"foo\" content=\"foo>\nbar\">";
          createParser(html);
-         parser.registerScanners ();
          parseAndAssertNodeCount (1);
          assertType ("should be MetaTag", MetaTag.class, node[0]);
--- 242,245 ----
***************
*** 262,266 ****
          String html = "<meta name=\"foo\" content=\"<foo\nbar\"";
          createParser(html);
-         parser.registerScanners ();
          parseAndAssertNodeCount (1);
          assertType ("should be MetaTag", MetaTag.class, node[0]);
--- 262,265 ----
***************
*** 284,287 ****
--- 283,287 ----
      {
          createParser("<html></html>");
+         parser.setNodeFactory (new PrototypicalNodeFactory (true));
          String testHtml1 = "<a HREF=\"/cgi-bin/view_search?query_text=postdate>20020701&txt_clr=White&bg_clr=Red&url=http://localhost/Testing/Report1.html\">20020702 Report 1</A>" +
                              TEST_HTML;
***************
*** 361,367 ****
              this.id = id;
              this.max = max;
!             this.parser = 
!                 Parser.createParser(testHtml);
!             parser.registerScanners();
          }
  
--- 361,365 ----
              this.id = id;
              this.max = max;
!             this.parser = Parser.createParser(testHtml);
          }
  
***************
*** 411,414 ****
--- 409,413 ----
          String html = "<input disabled>";
          createParser(html);
+         parser.setNodeFactory (new PrototypicalNodeFactory (true));
          parseAndAssertNodeCount (1);
          assertType ("should be Tag", Tag.class, node[0]);
***************
*** 424,427 ****
--- 423,427 ----
          String html = "<input disabled=>";
          createParser(html);
+         parser.setNodeFactory (new PrototypicalNodeFactory (true));
          parseAndAssertNodeCount (1);
          assertType ("should be Tag", Tag.class, node[0]);

[Htmlparser-cvs] htmlparser/src/org/htmlparser/tests/filterTests FilterTest.java,1.1,1.2

From: <der...@us...> - 2003-12-07 23:42:14

Update of /cvsroot/htmlparser/htmlparser/src/org/htmlparser/tests/filterTests
In directory sc8-pr-cvs1:/tmp/cvs-serv16537/tests/filterTests

Modified Files:
	FilterTest.java 
Log Message:
Remove most of the scanners.
The only scanners left are ones that really do something different (script and jsp).
Instead of registering a scanner to enable returning a specific tag you now add a 
tag to the a PrototypicalNodeFactory. All known tags are 'registered' by default
in a new Parser which is similar to having called the old 'registerDOMScanners()',
so tags are fully nested. This is different behaviour, and specifically,
you will need to recurse into returned nodes to get at what you want.
I've tried to adjust the applications accordingly, but worked examples are still scarce.
If you want to return only some of the derived tags while keeping most as generic tags,
there are various constructors and manipulators on the factory. See the javadocs
and examples in the tests package.
Nearly all the old scanner tests are folded into the tag tests.

toString() has been revamped.
This means that the default Parser mainline now returns an indented listing of tags,
making it easy to see the structure of a page. The downside is the text of the page
had to have newlines, tabs etc. turned into escape sequences. But if you were really
interested in content you would be using toHtml() or toPlainTextString().



Index: FilterTest.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/tests/filterTests/FilterTest.java,v
retrieving revision 1.1
retrieving revision 1.2
diff -C2 -d -r1.1 -r1.2
*** FilterTest.java	8 Nov 2003 21:30:58 -0000	1.1
--- FilterTest.java	7 Dec 2003 23:41:41 -0000	1.2
***************
*** 70,74 ****
          html = "<html>" + guts + "</html>";
          createParser (html);
-         parser.registerDomScanners ();
          list = parser.extractAllNodesThatMatch (new NodeClassFilter (BodyTag.class));
          assertEquals ("only one element", 1, list.size ());
--- 70,73 ----
***************
*** 93,97 ****
          html = "<html>" + guts + "</html>";
          createParser (html);
-         parser.registerDomScanners ();
          list = parser.extractAllNodesThatMatch (new TagNameFilter ("booty"));
          assertEquals ("only one element", 1, list.size ());
--- 92,95 ----
***************
*** 112,116 ****
          html = "<html>" + guts + "</html>";
          createParser (html);
-         parser.registerDomScanners ();
          list = parser.extractAllNodesThatMatch (new StringFilter ("Time"));
          assertEquals ("only one element", 1, list.size ());
--- 110,113 ----
***************
*** 134,138 ****
          html = "<html>" + guts + "</html>";
          createParser (html);
-         parser.registerDomScanners ();
          list = parser.extractAllNodesThatMatch (new HasChildFilter (new TagNameFilter ("b")));
          assertEquals ("only one element", 1, list.size ());
--- 131,134 ----
***************
*** 157,161 ****
          html = "<html>" + guts + "</html>";
          createParser (html);
-         parser.registerDomScanners ();
          list = parser.extractAllNodesThatMatch (new HasAttributeFilter ("id"));
          assertEquals ("only one element", 1, list.size ());
--- 153,156 ----
***************
*** 177,181 ****
          html = "<html>" + guts + "</html>";
          createParser (html);
-         parser.registerDomScanners ();
          list = parser.extractAllNodesThatMatch (
              new AndFilter (
--- 172,175 ----
***************
*** 203,207 ****
          html = "<html>" + guts + "</html>";
          createParser (html);
-         parser.registerDomScanners ();
          list = parser.extractAllNodesThatMatch (
              new OrFilter (
--- 197,200 ----
***************
*** 232,236 ****
          html = "<html>" + guts + "</html>";
          createParser (html);
-         parser.registerDomScanners ();
          list = parser.extractAllNodesThatMatch (
              new AndFilter (
--- 225,228 ----

[Htmlparser-cvs] htmlparser/src/org/htmlparser/tags CompositeTag.java,1.66,1.67 FormTag.java,1.41,1.42 ImageTag.java,1.36,1.37 InputTag.java,1.31,1.32 LabelTag.java,1.32,1.33 LinkTag.java,1.44,1.45 MetaTag.java,1.32,1.33 SelectTag.java,1.33,1.34 TableColumn.java,1.33,1.34 TableRow.java,1.35,1.36 TextareaTag.java,1.30,1.31

From: <der...@us...> - 2003-12-07 23:42:14

Update of /cvsroot/htmlparser/htmlparser/src/org/htmlparser/tags
In directory sc8-pr-cvs1:/tmp/cvs-serv16537/tags

Modified Files:
	CompositeTag.java FormTag.java ImageTag.java InputTag.java 
	LabelTag.java LinkTag.java MetaTag.java SelectTag.java 
	TableColumn.java TableRow.java TextareaTag.java 
Log Message:
Remove most of the scanners.
The only scanners left are ones that really do something different (script and jsp).
Instead of registering a scanner to enable returning a specific tag you now add a 
tag to the a PrototypicalNodeFactory. All known tags are 'registered' by default
in a new Parser which is similar to having called the old 'registerDOMScanners()',
so tags are fully nested. This is different behaviour, and specifically,
you will need to recurse into returned nodes to get at what you want.
I've tried to adjust the applications accordingly, but worked examples are still scarce.
If you want to return only some of the derived tags while keeping most as generic tags,
there are various constructors and manipulators on the factory. See the javadocs
and examples in the tests package.
Nearly all the old scanner tests are folded into the tag tests.

toString() has been revamped.
This means that the default Parser mainline now returns an indented listing of tags,
making it easy to see the structure of a page. The downside is the text of the page
had to have newlines, tabs etc. turned into escape sequences. But if you were really
interested in content you would be using toHtml() or toPlainTextString().



Index: CompositeTag.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/tags/CompositeTag.java,v
retrieving revision 1.66
retrieving revision 1.67
diff -C2 -d -r1.66 -r1.67
*** CompositeTag.java	9 Nov 2003 17:07:11 -0000	1.66
--- CompositeTag.java	7 Dec 2003 23:41:41 -0000	1.67
***************
*** 434,436 ****
--- 434,491 ----
          return stringNode;
      }
+ 
+     public String toString ()
+     {
+         StringBuffer ret;
+         
+         ret = new StringBuffer (1024);
+         toString (0, ret);
+         
+         return (ret.toString ());
+     }
+ 
+     /**
+      * Return the text contained in this tag.
+      * @return The complete contents of the tag (within the angle brackets).
+      */
+     public String getText ()
+     {
+         String ret;
+         
+         ret = super.toHtml ();
+         ret = ret.substring (1, ret.length () - 1);
+         
+         return (ret);
+     }
+ 
+     public void toString (int level, StringBuffer buffer)
+     {
+         Node node;
+ 
+         for (int i = 0; i < level; i++)
+             buffer.append ("  ");
+         buffer.append (super.toString ());
+         buffer.append (System.getProperty ("line.separator"));
+         for (SimpleNodeIterator e = children (); e.hasMoreNodes ();)
+         {
+             node = e.nextNode ();
+             if (node instanceof CompositeTag)
+                 ((CompositeTag)node).toString (level + 1, buffer);
+             else
+             {
+                 for (int i = 0; i <= level; i++)
+                     buffer.append ("  ");
+                 buffer.append (node);
+                 buffer.append (System.getProperty ("line.separator"));
+             }
+         }
+         // eliminate virtual tags
+ //        if (!(getEndTag ().getStartPosition () == getEndTag ().getEndPosition ()))
+         {
+             for (int i = 0; i <= level; i++)
+                 buffer.append ("  ");
+             buffer.append (getEndTag ().toString ());
+             buffer.append (System.getProperty ("line.separator"));
+         }
+     }
  }

Index: FormTag.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/tags/FormTag.java,v
retrieving revision 1.41
retrieving revision 1.42
diff -C2 -d -r1.41 -r1.42
*** FormTag.java	9 Nov 2003 17:07:11 -0000	1.41
--- FormTag.java	7 Dec 2003 23:41:41 -0000	1.42
***************
*** 56,60 ****
       * The set of end tag names that indicate the end of this tag.
       */
!     private static final String[] mEndTagEnders = new String[] {"HTML", "BODY"};
  
      /**
--- 56,60 ----
       * The set of end tag names that indicate the end of this tag.
       */
!     private static final String[] mEndTagEnders = new String[] {"HTML", "BODY", "TABLE"};
  
      /**

Index: ImageTag.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/tags/ImageTag.java,v
retrieving revision 1.36
retrieving revision 1.37
diff -C2 -d -r1.36 -r1.37
*** ImageTag.java	9 Nov 2003 17:07:11 -0000	1.36
--- ImageTag.java	7 Dec 2003 23:41:41 -0000	1.37
***************
*** 188,196 ****
      }
  
-     public String toString()
-     {
-         return "IMAGE TAG : Image at " + getImageURL () +"; begins at : "+getStartPosition ()+"; ends at : "+getEndPosition ();
-     }
- 
      public void setImageURL (String url)
      {
--- 188,191 ----

Index: InputTag.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/tags/InputTag.java,v
retrieving revision 1.31
retrieving revision 1.32
diff -C2 -d -r1.31 -r1.32
*** InputTag.java	9 Nov 2003 17:07:11 -0000	1.31
--- InputTag.java	7 Dec 2003 23:41:41 -0000	1.32
***************
*** 56,62 ****
          return (mIds);
      }
- 
-     public String toString() {
-         return (ParserUtils.toString(this));
-     }
  }
--- 56,58 ----

Index: LabelTag.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/tags/LabelTag.java,v
retrieving revision 1.32
retrieving revision 1.33
diff -C2 -d -r1.32 -r1.33
*** LabelTag.java	9 Nov 2003 17:07:11 -0000	1.32
--- LabelTag.java	7 Dec 2003 23:41:41 -0000	1.33
***************
*** 43,47 ****
  
      /**
!      * Create a new lavel tag.
       */
      public LabelTag ()
--- 43,47 ----
  
      /**
!      * Create a new label tag.
       */
      public LabelTag ()

Index: LinkTag.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/tags/LinkTag.java,v
retrieving revision 1.44
retrieving revision 1.45
diff -C2 -d -r1.44 -r1.45
*** LinkTag.java	9 Nov 2003 17:07:11 -0000	1.44
--- LinkTag.java	7 Dec 2003 23:41:41 -0000	1.45
***************
*** 31,35 ****
  
  import org.htmlparser.Node;
- import org.htmlparser.scanners.LinkScanner;
  import org.htmlparser.util.ParserUtils;
  import org.htmlparser.util.SimpleNodeIterator;
--- 31,34 ----

Index: MetaTag.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/tags/MetaTag.java,v
retrieving revision 1.32
retrieving revision 1.33
diff -C2 -d -r1.32 -r1.33
*** MetaTag.java	9 Nov 2003 17:07:11 -0000	1.32
--- MetaTag.java	7 Dec 2003 23:41:41 -0000	1.33
***************
*** 118,129 ****
          }
      }
- 
-     public String toString()
-     {
-         return "META TAG\n"+
-                 "--------\n"+
-                 "Http-Equiv : "+getHttpEquiv()+"\n"+
-                 "Name : "+ getMetaTagName() +"\n"+
-                 "Contents : "+getMetaContent()+"\n";
-     }
  }
--- 118,120 ----

Index: SelectTag.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/tags/SelectTag.java,v
retrieving revision 1.33
retrieving revision 1.34
diff -C2 -d -r1.33 -r1.34
*** SelectTag.java	9 Nov 2003 17:07:11 -0000	1.33
--- SelectTag.java	7 Dec 2003 23:41:41 -0000	1.34
***************
*** 99,122 ****
          return (ret);
      }
- 
-     public String toString()
-     {
-         StringBuffer lString;
-         NodeList children;
-         Node node;
- 
-         lString = new StringBuffer(ParserUtils.toString(this));
-         children = getChildren ();
-         for(int i=0;i<children.size(); i++)
-         {
-             node = children.elementAt(i);
-             if (node instanceof OptionTag)
-             {
-                 OptionTag optionTag = (OptionTag)node;
-                 lString.append(optionTag.toString()).append("\n");
-             }
-         }
- 
-         return lString.toString();
-     }
  }
--- 99,101 ----

Index: TableColumn.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/tags/TableColumn.java,v
retrieving revision 1.33
retrieving revision 1.34
diff -C2 -d -r1.33 -r1.34
*** TableColumn.java	9 Nov 2003 17:07:11 -0000	1.33
--- TableColumn.java	7 Dec 2003 23:41:41 -0000	1.34
***************
*** 40,43 ****
--- 40,53 ----
  
      /**
+      * The set of tag names that indicate the end of this tag.
+      */
+     private static final String[] mEnders = new String[] {"TD", "TR"};
+ 
+     /**
+      * The set of end tag names that indicate the end of this tag.
+      */
+     private static final String[] mEndTagEnders = new String[] {"TR", "TABLE"};
+ 
+     /**
       * Create a new table column tag.
       */
***************
*** 62,65 ****
--- 72,84 ----
      {
          return (mIds);
+     }
+ 
+     /**
+      * Return the set of end tag names that cause this tag to finish.
+      * @return The names of following end tags that stop further scanning.
+      */
+     public String[] getEndTagEnders ()
+     {
+         return (mEndTagEnders);
      }
  }

Index: TableRow.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/tags/TableRow.java,v
retrieving revision 1.35
retrieving revision 1.36
diff -C2 -d -r1.35 -r1.36
*** TableRow.java	9 Nov 2003 17:07:11 -0000	1.35
--- TableRow.java	7 Dec 2003 23:41:41 -0000	1.36
***************
*** 42,45 ****
--- 42,50 ----
  
      /**
+      * The set of end tag names that indicate the end of this tag.
+      */
+     private static final String[] mEndTagEnders = new String[] {"TABLE"};
+ 
+     /**
       * Create a new table row tag.
       */
***************
*** 64,67 ****
--- 69,81 ----
      {
          return (mIds);
+     }
+ 
+     /**
+      * Return the set of end tag names that cause this tag to finish.
+      * @return The names of following end tags that stop further scanning.
+      */
+     public String[] getEndTagEnders ()
+     {
+         return (mEndTagEnders);
      }
  

Index: TextareaTag.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/tags/TextareaTag.java,v
retrieving revision 1.30
retrieving revision 1.31
diff -C2 -d -r1.30 -r1.31
*** TextareaTag.java	9 Nov 2003 17:07:11 -0000	1.30
--- TextareaTag.java	7 Dec 2003 23:41:41 -0000	1.31
***************
*** 88,98 ****
          return toPlainTextString();
      }
- 
-     public String toString()
-     {
-         StringBuffer buff = new StringBuffer(ParserUtils.toString(this));
-         buff.append("VALUE : ").append(getValue()).append("\n");
- 
-         return buff.toString();
-     }
  }
--- 88,90 ----

[Htmlparser-cvs] htmlparser/src/org/htmlparser/scanners ScriptScanner.java,1.51,1.52 AppletScanner.java,1.36,NONE BaseHrefScanner.java,1.31,NONE BodyScanner.java,1.23,NONE BulletListScanner.java,1.22,NONE BulletScanner.java,1.28,NONE DivScanner.java,1.34,NONE DoctypeScanner.java,1.32,NONE FormScanner.java,1.54,NONE FrameScanner.java,1.33,NONE FrameSetScanner.java,1.32,NONE HeadScanner.java,1.20,NONE HtmlScanner.java,1.34,NONE ImageScanner.java,1.35,NONE InputTagScanner.java,1.30,NONE LabelScanner.java,1.38,NONE LinkScanner.java,1.62,NONE MetaTagScanner.java,1.30,NONE OptionTagScanner.java,1.39,NONE SelectTagScanner.java,1.37,NONE SpanScanner.java,1.36,NONE StyleScanner.java,1.31,NONE TableColumnScanner.java,1.40,NONE TableRowScanner.java,1.43,NONE TableScanner.java,1.42,NONE TextareaTagScanner.java,1.34,NONE TitleScanner.java,1.36,NONE

From: <der...@us...> - 2003-12-07 23:42:14

Update of /cvsroot/htmlparser/htmlparser/src/org/htmlparser/scanners
In directory sc8-pr-cvs1:/tmp/cvs-serv16537/scanners

Modified Files:
	ScriptScanner.java 
Removed Files:
	AppletScanner.java BaseHrefScanner.java BodyScanner.java 
	BulletListScanner.java BulletScanner.java DivScanner.java 
	DoctypeScanner.java FormScanner.java FrameScanner.java 
	FrameSetScanner.java HeadScanner.java HtmlScanner.java 
	ImageScanner.java InputTagScanner.java LabelScanner.java 
	LinkScanner.java MetaTagScanner.java OptionTagScanner.java 
	SelectTagScanner.java SpanScanner.java StyleScanner.java 
	TableColumnScanner.java TableRowScanner.java TableScanner.java 
	TextareaTagScanner.java TitleScanner.java 
Log Message:
Remove most of the scanners.
The only scanners left are ones that really do something different (script and jsp).
Instead of registering a scanner to enable returning a specific tag you now add a 
tag to the a PrototypicalNodeFactory. All known tags are 'registered' by default
in a new Parser which is similar to having called the old 'registerDOMScanners()',
so tags are fully nested. This is different behaviour, and specifically,
you will need to recurse into returned nodes to get at what you want.
I've tried to adjust the applications accordingly, but worked examples are still scarce.
If you want to return only some of the derived tags while keeping most as generic tags,
there are various constructors and manipulators on the factory. See the javadocs
and examples in the tests package.
Nearly all the old scanner tests are folded into the tag tests.

toString() has been revamped.
This means that the default Parser mainline now returns an indented listing of tags,
making it easy to see the structure of a page. The downside is the text of the page
had to have newlines, tabs etc. turned into escape sequences. But if you were really
interested in content you would be using toHtml() or toPlainTextString().



Index: ScriptScanner.java
===================================================================
RCS file: /cvsroot/htmlparser/htmlparser/src/org/htmlparser/scanners/ScriptScanner.java,v
retrieving revision 1.51
retrieving revision 1.52
diff -C2 -d -r1.51 -r1.52
*** ScriptScanner.java	9 Nov 2003 17:07:10 -0000	1.51
--- ScriptScanner.java	7 Dec 2003 23:41:40 -0000	1.52
***************
*** 30,35 ****
--- 30,37 ----
  
  import java.util.Vector;
+ 
  import org.htmlparser.Node;
  import org.htmlparser.Parser;
+ import org.htmlparser.PrototypicalNodeFactory;
  import org.htmlparser.RemarkNode;
  import org.htmlparser.StringNode;
***************
*** 47,51 ****
   * It gathers all interior nodes into one undifferentiated string node.
   */
! public class ScriptScanner extends CompositeTagScanner {
      private static final String SCRIPT_END_TAG = "</SCRIPT>";
      private static final String MATCH_NAME [] = {"SCRIPT"};
--- 49,56 ----
   * It gathers all interior nodes into one undifferentiated string node.
   */
! public class ScriptScanner
!     extends
!         CompositeTagScanner
! {
      private static final String SCRIPT_END_TAG = "</SCRIPT>";
      private static final String MATCH_NAME [] = {"SCRIPT"};
***************
*** 101,105 ****
          end = null;
          factory = lexer.getNodeFactory ();
!         lexer.setNodeFactory (new Parser ()); // no scanners on a new Parser right?
          try
          {
--- 106,110 ----
          end = null;
          factory = lexer.getNodeFactory ();
!         lexer.setNodeFactory (new PrototypicalNodeFactory (true));
          try
          {

--- AppletScanner.java DELETED ---

--- BaseHrefScanner.java DELETED ---

--- BodyScanner.java DELETED ---

--- BulletListScanner.java DELETED ---

--- BulletScanner.java DELETED ---

--- DivScanner.java DELETED ---

--- DoctypeScanner.java DELETED ---

--- FormScanner.java DELETED ---

--- FrameScanner.java DELETED ---

--- FrameSetScanner.java DELETED ---

--- HeadScanner.java DELETED ---

--- HtmlScanner.java DELETED ---

--- ImageScanner.java DELETED ---

--- InputTagScanner.java DELETED ---

--- LabelScanner.java DELETED ---

--- LinkScanner.java DELETED ---

--- MetaTagScanner.java DELETED ---

--- OptionTagScanner.java DELETED ---

--- SelectTagScanner.java DELETED ---

--- SpanScanner.java DELETED ---

--- StyleScanner.java DELETED ---

--- TableColumnScanner.java DELETED ---

--- TableRowScanner.java DELETED ---

--- TableScanner.java DELETED ---

--- TextareaTagScanner.java DELETED ---

--- TitleScanner.java DELETED ---

[Htmlparser-cvs] htmlparser/src/org/htmlparser/parserapplications LinkExtractor.java,1.47,1.48 MailRipper.java,1.48,1.49 Robot.java,1.50,1.51