# # django-admin.py startproject djangoapp
# # Create your django model: django startapp website
# # Edit scrapy settings.py with method to point to Django environment
# # Create a pipeline that accesses Django using the model.save() method
 
***settings.py***
 
import os
ITEM_PIPELINES = ['myapp.pipelines.DjangoPipeline']
 
# http://stackoverflow.com/questions/4271975/access-django-models-inside-of-scrapy
def setup_django_env(path):
    import imp, os
    from django.core.management import setup_environ
 
    f, filename, desc = imp.find_module('settings', [path])
    project = imp.load_module('settings', f, filename, desc)       
 
    setup_environ(project)
 
 
current_dir = os.path.abspath(os.path.dirname(os.path.dirname(__file__)))
setup_django_env(os.path.join(current_dir, '../djangoapp/'))
 
***pipelines.py***
from djangoapp.websites.models import Website
from django.db.utils import IntegrityError
 
class DjangoPipeline(object):
 
    def process_item(self, item, spider):
        website = Website(link=item['link'][0],
                created=datetime.datetime.now(),
                )
        try:
          website.save()
        except IntegrityError:
          raise DropItem("Contains duplicate domain: %s" % item['link'][0])
        return item
 
***djangoapp model***
 
from django.db import models
 
class Website(models.Model):
    link = models.CharField(max_length=200, unique=True)
    created = models.DateTimeField('date created')
 
    def __unicode__(self):
            return u"%s" % self.link
 
 
 
#//python/8391

回复 "在Django中使用scrapy"

这儿你可以回复上面这条便签

作者你的名字是？

标题给你的便签一个标题。

语言你的便签是以

你的便签在这儿输入便签内容

# # django-admin.py startproject djangoapp
# # Create your django model: django startapp website
# # Edit scrapy settings.py with method to point to Django environment
# # Create a pipeline that accesses Django using the model.save() method
 
***settings.py***
 
import os
ITEM_PIPELINES = ['myapp.pipelines.DjangoPipeline']
 
# http://stackoverflow.com/questions/4271975/access-django-models-inside-of-scrapy
def setup_django_env(path):
    import imp, os
    from django.core.management import setup_environ
 
    f, filename, desc = imp.find_module('settings', [path])
    project = imp.load_module('settings', f, filename, desc)       
 
    setup_environ(project)
 
 
current_dir = os.path.abspath(os.path.dirname(os.path.dirname(__file__)))
setup_django_env(os.path.join(current_dir, '../djangoapp/'))
 
***pipelines.py***
from djangoapp.websites.models import Website
from django.db.utils import IntegrityError
 
class DjangoPipeline(object):
 
    def process_item(self, item, spider):
        website = Website(link=item['link'][0],
                created=datetime.datetime.now(),
                )
        try:
          website.save()
        except IntegrityError:
          raise DropItem("Contains duplicate domain: %s" % item['link'][0])
        return item
 
***djangoapp model***
 
from django.db import models
 
class Website(models.Model):
    link = models.CharField(max_length=200, unique=True)
    created = models.DateTimeField('date created')
 
    def __unicode__(self):
            return u"%s" % self.link

#//python/8391

创建短链接创建一个较短的URL，连接到这个便签

私人私人便签不会显示在最近列表中

保存期限我们应该什么时候删除这张便签？

防滥用键入这些字符

Code666 (代码贴、代码片段)

[Python] 在Django中使用scrapy →→→→→进入此内容的聊天室

回复 "在Django中使用scrapy"