尝试编写一个ORM框架。
github地址
ORM全称“Object Relational Mapping”,即对象-关系映射,就是把关系数据库的一行映射为一个对象,也就是一个类对应一个表,这样,写代码更简单,不用直接操作SQL语句。
编写底层模块的第一步,就是先把调用接口写出来。比如,使用者如果使用这个ORM框架,想定义一个User类来操作对应的数据库表User。
理想的调用接口1
2
3
4
5
6
7
8
9
10class User(Model):
# 定义类的属性到列的映射:
id = IntegerFied('id')
name = StringField('username')
pwd = StringField('password')
# 创建一个实例:
u = User(id=12345, name='Michael', password='my-pwd')
# 保存到数据库:
u.save()
具体实现
首先定义Field类,它负责保存数据库表的字段名和字段类型:1
2
3
4
5
6class Field(object):
def __init__(self, name, column_type):
self.name = name
self.column_type = column_type
def __str__(self):
return '<%s:%s>' % (self.__class__.__name__, self.name)
在Field的基础上,进一步定义各种类型的Field,比如StringField,IntegerField等等:1
2
3
4
5
6
7class StringField(Field):
def __init__(self, name):
super(StringField, self).__init__(name, 'varchar(100)')
class IntegerField(Field):
def __init__(self, name):
super(IntegerField, self).__init__(name, 'bigint')
super(StringField, self)与直接写父类Field名实现一样,但super()的好处就是可以避免直接使用父类的名字
编写元类 ModelMetaclass
:1
2
3
4
5
6
7
8
9
10
11
12
13
14class ModelMetaclass(type):
def __new__(cls, name, bases, attrs):
if name=='Model':
return type.__new__(cls, name, bases, attrs)
mappings = dict()
for k, v in attrs.iteritems():
if isinstance(v, Field):
print('Found mapping: %s==>%s' % (k, v))
mappings[k] = v
for k in mappings.iterkeys():
attrs.pop(k)
attrs['__table__'] = name # 假设表名和类名一致
attrs['__mappings__'] = mappings # 保存属性和列的映射关系
return type.__new__(cls, name, bases, attrs)
cls: 当前准备创建的类的对象
name: 类的名字
bases: 类继承的父类集合
attrs: 类的方法集合(字典类里的方法和它本身自定义的)
基类Model1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26class Model(dict):
__metaclass__ = ModelMetaclass
def __init__(self, **kw):
super(Model, self).__init__(**kw)
def __getattr__(self, key):
try:
return self[key]
except KeyError:
raise AttributeError(r"'Model' object has no attribute '%s'" % key)
def __setattr__(self, key, value):
self[key] = value
def save(self):
fields = []
params = []
args = []
for k, v in self.__mappings__.iteritems():
fields.append(v.name)
params.append('?')
args.append(getattr(self, k, None))
sql = 'insert into %s (%s) values (%s)' % (self.__table__, ','.join(fields), ','.join(params))
print('SQL: %s' % sql)
print('ARGS: %s' % str(args))
当用户定义一个class User(Model)时,Python解释器首先在当前类User的定义中查找__metaclass__
,如果没有找到,就继续在父类Model中查找__metaclass__
,找到了,就使用Model中定义的__metaclass__
的ModelMetaclass来创建User类,也就是说,metaclass可以隐式地继承到子类,但子类自己却感觉不到。
在ModelMetaclass中,一共做了几件事情:
- 排除掉对Model类的修改;
- 在当前类(比如User)中查找定义的类的所有属性,如果找到一个Field属性,就把它保存到一个
__mappings__
的dict中,同时从类属性中删除该Field属性,否则,容易造成运行时错误; - 把表名保存到
__table__
中,这里简化为表名默认为类名。
在Model类中,就可以定义各种操作数据库的方法,比如save(),delete(),find(),update等等。
1 | u = User(id=12345, name='Michael', email='test@orm.org', password='my-pwd') |
输出如下:1
2
3
4
5
6
7Found model: User
Found mapping: email ==> <StringField:email>
Found mapping: password ==> <StringField:password>
Found mapping: id ==> <IntegerField:uid>
Found mapping: name ==> <StringField:username>
SQL: insert into User (password,email,username,uid) values (?,?,?,?)
ARGS: ['my-pwd', 'test@orm.org', 'Michael', 12345]