将XML结点转换成JAVABEAN并存入数据库
副标题#e#
1.概述
我们要将外部系统给的XML文件举办理会,并存入到数据库。
可是我们并没有DTD可能Schema,只有一个WORD名目标说明文档;更离谱的是,XML结点树的布局(即XML结点与XML结点之间的干系)与业务Bean树的布局(即业务Bean与业务Bean的干系)并不完全一致,好比说,从业务角度讲,一只猪有只猪头,而在XML里,却写成了 pig –content –pighead 的三级干系,无端端多了一个content结点! 没有DTD/Schema,布局又不类型,我们就没法用自动化的第三方JAVA转换API举办理会,而只妙手动地、一个一个地理会。但在手动理会的进程中,我们仍然发明各个结点的理会和入库中有许多对象是配合的,可能有配合的纪律,这些对象可以抽出来作为一个准框架,然后再将结点中差异的部门开放出来,答允详细的结点做详细的实现,并最终形成一个半自动的理会/入库框架。
为什么说它是半自动的?它有哪些限制?
自动:不必为每个结点编写XML 理会代码和入库代码
“半”:需手动地编写每个JAVABEAN,并手动地为每个BEAN建表
限制:
a.所有业务字段的范例只能设为STRING/VARCHAR,而且非业务字段的范例在BEAN中不能为STRING
b.BEAN名与表名必需沟通,可能可以举办一对一映射
c.BEAN的成员变量名必需与XML结点的属性名/元素名沟通,可能可以举办一对一映射
这三种限制都是操作JAVA反射机制举办自动操纵的前提。
2.根基思想
所谓的XML理会,就是将XML结点转换成JAVABEAN实例,XML结点的ATTRIBUTE值和ELEMENT值就是JAVABEAN实例的成员变量值; 所谓的耐久化,就是将JAVABEAN实例酿成数据库对应表中的一笔记录,JAVABEAN实例的成员变量值就是记录中某个字段的值,可能其他表中某个参考了该记录的另一笔记录。
而在XML中,JAVABEAN体系中,数据据表干系布局中,结点和结点之间的干系都是树形的干系。整体的理会和入库,就是在遍历树时执行转换行动。而我们知道,树的遍历是可以用递归算法实现的,而递归,就不消说了吧,它是实现措施“自动化”的主要途径之一。
以下是对各“树”的详细阐明:
假设两个业务实体A和B之间存在聚合干系(父子干系)。那么详细可分三种环境:
a.B是一个原子字段(即不行再分),而且是A的一个属性。
XML中,B是A的XML ATTRIBUTE可能A的原子ELEMENT
BEAN中,B是A的成员变量,而且B是一个JAVA内置的数据范例
数据库中,B是A表的一个列
b.B是一个复合字段,而且是A的一个属性,并且和A是1:1干系
XML中,B是A的ELEMENT,而且B有本身的ELEMENT可能ATTRIBUTE
BEAN中,B是A的成员变量,而且措施中有个B类
数据库中,B表是A表的子表(即B外键参考了A表)
c.B是一个复合字段,而且是A的一个属性,并且和A是N:1干系
XML中,B是A的ELEMENT,而且B有本身的ELEMENT可能ATTRIBUTE
BEAN中,B构成一个类集(List,Set)配相助为A的成员变量,而且措施中有个B类
数据库中,B表是A表的子表(即B外键参考了A表)
相识了这三种环境,接下来就好办了。措施每抓到一个结点,都要递归地举办以下处理惩罚:先处理惩罚它的原子属性(景象a),接着处理惩罚它的单个子结点(景象b),最后处理惩罚它的类集子结点( 景象c)。
#p#副标题#e#
3.代码实现的重点
两个重点:
a.如何让业务实体在三棵树内一一对应好?
b.如何发明树形干系,好比A的属性有哪些,A的子结点有哪些?
问题a很简朴,就是让三棵树里沟通的业务实体取沟通的名字。
a.理会XML时发明 结点X 的 属性Y 便是 值Z,则执行PropertyUtils.setProperty(结点X , 属性Y , 值Z)即可。在这里X,Y,Z是变量,措施不消体贴详细的结点和属性是哪些个。需要留意的是,假如属性Y是原子字段,则要求属性Y必需为String范例,不然措施不知道将值Z转换成哪种范例(注:关于PropertyUtils, 请见apache commons Beanutils )
b.入库时发明x.getY()=z。假如属性y是原子字段,则执行SQL insert into X(…,y,…) values (…,z,…),这里要求y字段必需为varchar/char范例, 以免产生范例转换错误.
关于问题b
XML树:JDOM, dom4j等都可以直接找到父子干系
BEAN体系:
I.原子属性。我们限定一个BEAN中所有有业务意义的原子字段的范例都STRING,所有String范例的字段都是业务字段
II.单个子结点。我们让所有有业务意义的非原子字段都实现一个配合的接口BusiNode,这样一个BEAN中所有BusiNode成员都是这个BEAN的子结点
III.类集子结点。我们也可以限定所有且只有类集子结点可以利用List或Set范例,这样可以操作过滤出所有类集子结点。然而,在JAVA1.4及以前的版本里,措施并不知道过滤出的类集子结点是哪个Class的实例(因为没有泛型),也就没步伐实例化一个类集子结点(见后文),因此只妙手动注册类集子结点的属性名和Class。JAVA1.5以上的版本我没用过,不知道可不行以办理这个问题。
#p#分页标题#e#
数据库表干系: 这就不消多说了,就是通过外键参考。因此每类结点对应的表中,都必需有个外键,以参考它的父结点;还必需有个主键,以供它的子结点参考。各表的外键名必需沟通并为一常数,不然措施生成INSERT SQL时才可以不消剖析详细表的详细的外键名。
措施在理会时,遍历的是BEAN树;在耐久化时也是。比起XML树,BEAN树代表真正的业务布局;比起数据库表干系树,BEAN树才气由父至子地举办先序遍历
4.其他问题
a.要让措施知道,原子属性中哪些是XML结点的属性,哪些是XML结点的原子ELEMENT。代码中这是两个抽象要领,必需让详细的结点类实现
b.回首本文概述部门提到的“pig –content –pighead 的三级干系,无端端多了一个content结点”,因此我们要让措施知道,pighead,pigfoot等结点的子结点,毕竟是pig,照旧pig下的content。处理惩罚不类型XML时要留意这个问题。这也是一个抽象要领,必需让详细的结点类实现
c.与上一条雷同但更失常的,是类集结点的不类型问题。假设一个pig有多个pighead,那布局大概为 pig–pighead,pighead,…,也大概为pig–pigheads–content,content…. 必需让措施知道某个详细结点用的是哪种模式
5.代码
焦点:多态 + 递归
a.接口BusiNode
import java.util.*;
import org.dom4j.Element;
/**
* 每个结点都要实现的接口
* 它提供了一些要领以利便实现递归的XML理会和耐久化
*
*/
public interface BusiNode {
/**
* 所有范例为不行分范例的属性
* @return 属性名的荟萃
*/
public List getAtomicPropNames();
/**
* 一些成员变量。这些成员变量是XML结点的属性
* @return
*/
public List getXmlAttributes();
/**
* 一些成员变量。这些成员变量是XML结点的子元素,而且范例为不行分的
* @return
*/
public List getXmlAtomicElements();
/**
* 所有范例为类集的属性,而且这些类会合每个元素的范例都是BusiNode
* @return key = 属性名, value = 属性类的Class工具。
* 假如为空不返回NULL,而是空的MAP
*/
public Map getCollectionPropsMap();
/**
* 所有范例为BusiNode的属性
* @return 属性名的荟萃
*/
public List getBusiNodePropNames();
/**
* 从XML中理会出来。
* @param element
* @return
*/
public void parseFromXML(Element element);
}
b.默认的实现
import java.lang.reflect.Field;
import java.util.*;
import org.apache.commons.beanutils.PropertyUtils;
import org.dom4j.Attribute;
import org.dom4j.Element;
/**
* 默认的BUSI NODE。 担任此类的BUSI NODE 需满意 所有不行分属性集=String范例的属性集
* MyUtils类的代码欠奉
*
*/
public abstract class DefaultBusiNode implements BusiNode {
public List getAtomicPropNames() {
return MyUtils.getFieldNamesOfClass(this.getClass(), String.class);
}
public List getBusiNodePropNames() {
return MyUtils.getFieldNamesOfClass(this.getClass(), BusiNode.class);
}
/*
* 所有子元素的父元素。有时是本结点,有时是本结点下的元素。失常
*/
public abstract Element getXmlElementParent(Element rootElement);
/*
* 类集子结点根元素的Iterator 。 假设一个pig有多个pighead,
* 那布局大概为 pig--pighead,pighead,...,
* 也大概为pig--pigheads--content,content....
* 必需让措施知道某个详细结点用的是哪种模式
*
* 假如为空则返回一个空类集的Iterator ,不要返回NULL
*/
public abstract Iterator getCollectionElementIterator(
Element xmlElementParent, String attName);
/**
* 理会XML属性
*
* @param rootElement
*/
protected void parseAttributesFromXml(Element rootElement) {
List xmlAttributes = this.getXmlAttributes();
for (int i = 0; i < this.getXmlAttributes().size(); i++) {
String attName = (String) xmlAttributes.get(i);
Attribute att = rootElement.attribute(attName);
if (att != null) {
try {
PropertyUtils.setProperty(this, attName, att.getValue());
} catch (Exception e) {
throw new RuntimeException(e);
}
}
}
}
/**
* 理会不行分的Element
*
* @param rootElement
*/
protected void parseAtomicElementFromXml(Element rootElement) {
Element xmlElementParent = getXmlElementParent(rootElement);
if (xmlElementParent == null) {
return;
}
List xmlElements = this.getXmlAtomicElements();
for (int i = 0; i < xmlElements.size(); i++) {
String attName = (String) xmlElements.get(i);
Element elmt = xmlElementParent.element(attName);
if (elmt != null) {
try {
PropertyUtils.setProperty(this, attName, elmt.getText());
} catch (Exception e) {
throw new RuntimeException(e);
}
}
}
}
/**
* 理会BusiNode属性
*
* @param rootElement
*/
protected void parseBusiNodeElementFromXml(Element rootElement) {
Element xmlElementParent = getXmlElementParent(rootElement);
if (xmlElementParent == null) {
return;
}
// 再理会BusiNode属性
List busiNodePropNames = this.getBusiNodePropNames();
for (int i = 0; i < busiNodePropNames.size(); i++) {
try {
String attName = (String) busiNodePropNames.get(i);
Element elmt = xmlElementParent.element(attName);
if (elmt != null) {
Field field = this.getClass().getDeclaredField(attName);
BusiNode att = (BusiNode) field.getType().newInstance();
att.parseFromXML(elmt);
PropertyUtils.setProperty(this, attName, att);
}
} catch (Exception e) {
throw new RuntimeException(e);
}
}
}
/**
* 理会类集属性
*
* @param rootElement
*/
protected void parseCollectionPropsFromXml(Element rootElement) {
// 先理会XML属性
Element xmlElementParent = getXmlElementParent(rootElement);
if (xmlElementParent == null) {
return;
}
// 最后理会类集属性
Map collectionPropsMap = this.getCollectionPropsMap();
for (Iterator it = collectionPropsMap.keySet().iterator(); it.hasNext();) {
try {
String attName = (String) it.next();
Collection coll = (Collection) PropertyUtils.getProperty(this,
attName);
Class attType = (Class) collectionPropsMap.get(attName);
Iterator collElementsIt = this.getCollectionElementIterator(
xmlElementParent, attName);
// xmlElementParent.elementIterator(attName);
while (collElementsIt.hasNext()) {
Element collElmt = (Element) collElementsIt.next();
BusiNode sinlgeAtt = (BusiNode) attType.newInstance();
sinlgeAtt.parseFromXML(collElmt);
coll.add(sinlgeAtt);
}
} catch (Exception e) {
throw new RuntimeException(e);
}
}
}
/**
* 从XML中理会出结点。此要领大概抛出RumtimeException
*/
public void parseFromXML(Element rootElement) {
this.parseAttributesFromXml(rootElement);
this.parseAtomicElementFromXml(rootElement);
this.parseBusiNodeElementFromXml(rootElement);
this.parseCollectionPropsFromXml(rootElement);
}
}
/**
* 入库
* JdbcUtil,MyUtils的代码欠奉
*
*/
public class BusiNodeDAO {
private Long saveBusiNode(BusiNode node, Long parentNodeId) {
// 先存储原子属性
Long id = saveBareBusiNode(node, parentNodeId);
// 再存储类集属性
Map collectionPropsMap = node.getCollectionPropsMap();
for (Iterator it = collectionPropsMap.keySet().iterator(); it.hasNext();) {
String attName = (String) it.next();
Collection coll = null;
try {
coll = (Collection) PropertyUtils.getProperty(node, attName);
} catch (Exception e) {
throw new RuntimeException("编码错误");
}
for (Iterator iitt = coll.iterator(); iitt.hasNext();) {
BusiNode subNode = (BusiNode) iitt.next();
saveBusiNode(subNode, id);
}
}
// 最后存储所有BusiNode属性
Iterator iitt = node.getBusiNodePropNames().iterator();
while (iitt.hasNext()) {
BusiNode subNode = null;
try {
subNode = (BusiNode) PropertyUtils.getProperty(node,
(String) iitt.next());
} catch (Exception e) {
throw new RuntimeException("编码错误");
}
if (subNode != null) {
saveBusiNode(subNode, id);
}
}
return id;
}
/**
* 插入某个BusiNode的根结点,此要领大概抛出RuntimeException
*
* @param node
* @return
*/
private Long saveBareBusiNode(BusiNode node, Long parentNodeId) {
StringBuffer sbForSql = new StringBuffer();
List paramValues = new ArrayList();
genInsertSqlAndParam(node, parentNodeId, node.getAtomicPropNames(),
sbForSql, paramValues);
return new Long(JdbcUtil.queryForLong(
sbForSql.toString(), paramValues.toArray()));
}
/**
* 生成某个结点的插入语句和paramValues数组,此要领大概抛出RuntimeException
*
* @param node
* @param columnNames
* @param sbForSql
* @param paramValues
*/
private void genInsertSqlAndParam(BusiNode node, Long parentNodeId,
List columnNames, StringBuffer sbForSql, List paramValues) {
sbForSql.append(" insert into ");
sbForSql.append(MyUtils.getClassBareName(node.getClass()));
List cns = new ArrayList();
cns.addAll(columnNames);
cns.add("parentNodeId");
sbForSql.append(MyUtils.encloseWithCurve(MyUtils
.joinCollectionStrings(cns, ",")));
sbForSql.append(" values ");
List qms = new ArrayList(); // 问号
for (Iterator it = columnNames.iterator(); it.hasNext();) {
qms.add("?");
String cn = (String) it.next();
try {
paramValues.add(PropertyUtils.getProperty(node, cn));
} catch (Exception e) {
throw new RuntimeException(e);
}
}
qms.add("?"); // parentNodeId
paramValues.add(parentNodeId);
sbForSql.append(MyUtils.encloseWithCurve(MyUtil
.joinCollectionStrings(qms, ",")));
sbForSql.append(";select @@identity");
}
}