V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
ftrect
V2EX  ›  程序员

求各位老师给个思路,做一个简单的搜索引擎,需要什么知识,多久能做出来。

  •  
  •   ftrect · 2013-03-11 00:45:02 +08:00 · 4119 次点击
    这是一个创建于 4274 天前的主题,其中的信息可能已经有所发展或是发生改变。
    数据量很多,类似与天涯泄漏的密码那种量,我需要怎么做?有没有什么开源的程序,将数据放进去就可以的?我是菜鸟,只略懂html,数据库知识一点点,我该如何下手?
    16 条回复    1970-01-01 08:00:00 +08:00
    ritksm
        1
    ritksm  
       2013-03-11 00:49:44 +08:00   ❤️ 1
    Weakdancer
        2
    Weakdancer  
       2013-03-11 00:51:08 +08:00
    搜索引擎 这个不能这么叫。
    使用 grep 软件就可实现。
    grep:
    http://blog.devep.net/virushuo/2005/10/31/grep-for-windows.html

    用法:
    cmd 中: grep 要找的文本 查找的文件的正则表示
    例如:
    grep myname *.*
    ftrect
        3
    ftrect  
    OP
       2013-03-11 00:54:14 +08:00
    @ritksm 有没有php的?
    ftrect
        4
    ftrect  
    OP
       2013-03-11 00:54:58 +08:00
    @Weakdancer 想做成网页的形式,该怎么做呢?
    iCodex
        5
    iCodex  
       2013-03-11 01:05:07 +08:00
    @ftrect,你用PHP的话,就POST提交查询呗。但数据量大查询起来费力啊。
    enj0y
        6
    enj0y  
       2013-03-11 01:06:16 +08:00
    你需要阿里云“云搜索”
    http://css.aliyun.com/manager/index

    你可以这样理解他:
    1.你有一个理论上无限大的数据容量库,named Index(索引)
    2.你可以随时随地插入、更新、删除记录,named Archive(文档)
    3.你可以在你需要时,你可以通过网络API向CSS服务器发起包含关键字的搜索请求
    4.你可以在这里下载到SDK:http://css.aliyun.com/manager/download
    ftrect
        7
    ftrect  
    OP
       2013-03-11 01:13:05 +08:00
    @iCodex 像这种情况用什么语言好?我已经决定自学了。
    colincat
        8
    colincat  
       2013-03-11 01:15:35 +08:00 via iPhone   ❤️ 1
    多少数据算多?10亿还是20亿?数据库加个索引一查就行了,你这个根本不需要搜索引擎吧
    saturn
        9
    saturn  
       2013-03-11 01:31:09 +08:00   ❤️ 1
    推荐SphinxSearch,基础PHP+基础Linux知识+比较好的英文水平,专研下一个星期应该可以学会基本的东西。
    Tianpu
        10
    Tianpu  
       2013-03-11 08:48:12 +08:00 via iPhone   ❤️ 4
    www.xunsearch.com

    需要比较大量数据的案例私信我

    右上角两厘米是感谢,我要金子
    Mac
        11
    Mac  
       2013-03-11 09:13:08 +08:00
    LZ的要求到底是什么,数据搜索还是数据展示?一个表能放全的数据库,每本PHP+MYSQL 书都会有例子。太容易了。
    ftrect
        12
    ftrect  
    OP
       2013-03-11 17:59:48 +08:00
    @Mac 是数据展示,数据有可能要增加,或者删除一些。自学一下吧,当时练习着玩了。
    Mac
        13
    Mac  
       2013-03-11 19:19:44 +08:00
    @ftrect PHPMaker 9,自己GOOGLE一下,有0DAY的,我就不提供链接了,只要会自己建MYSQL数据库就可以了,这个应该不难吧,网上工具一大堆。
    Weakdancer
        14
    Weakdancer  
       2013-03-12 00:46:51 +08:00   ❤️ 1
    我还是决定泼一点冷水。

    既然你已经“略懂html”,我不知道这是代表什么,我不清楚一个人怎么才能实现“略懂html”的。略懂数据库到还是能的。

    google:site:v2ex.com/t 天涯密码

    http://vsean.net/blog/post/98
    Weakdancer
        15
    Weakdancer  
       2013-03-12 00:54:54 +08:00
    >像这种情况用什么语言好?我已经决定自学了。
    所有语言来说对于自己都是”不会的语言“。

    表达”像这种情况用什么语言好?我已经决定自学了。“用什么语言好?
    表达”bus“用什么语言好?这个问题还算有一定的意义(除了中文之外的语言好)。
    http://myswap.sinaapp.com/wd/bus

    最后,你的所有需求 SAE 都可以满足。
    ftrect
        16
    ftrect  
    OP
       2013-03-13 18:15:36 +08:00
    @Weakdancer 谢谢,前年看过一本介绍html的书,知道网页的结构,部分标签可以手写出来,但是不熟练。我这样说只是提供我所有的关于网络的知识,哈哈,门外汉的本质被你无情揭穿。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   983 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 21:19 · PVG 05:19 · LAX 13:19 · JFK 16:19
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.